#Google 搜尋
OpenAI將要被反殺?Google這一局,埋了整整十年……
2023 年初的那個冬天,當 ChatGPT 橫空出世,驚豔全球時,Google 看起來像是一個垂垂老矣的巨人。圖片 | 來自網路華爾街拋售股票,內部發佈“紅色程式碼”(Code Red),關於“搜尋已死”的訃告充斥著科技媒體的頭版,內部員工一邊調侃自己在“養老廠”,一邊焦慮。當時的金融和科技領域均不看好效率低下的搜尋業務然而,僅僅不到三年後的今天,戰局的風向正在發生微妙而劇烈的逆轉。當 OpenAI 為昂貴的算力帳單發愁,當整個行業因為 Nvidia GPU 的產能瓶頸而焦慮時,Google 卻憑藉 Gemini 模型展示了百萬級的長文字能力,並悄然建構了全球成本最低的 AI 推理基礎設施。對,是全球。資料顯示,自 Gemini 3 發佈以來的過去 6 周內,ChatGPT 的流量下降了 22%,7天平均訪問使用者數從約2.03億下降到約1.58億。這可能與假期流量回落有關,但Gemini的流量保持基本持平,而且目前已經達到ChatGPT的約40%。ChatGPT 與 Gemini流量對比而這場勝利的草蛇灰線,早在 2013 年就已經埋下——今天我們就要盤一下,Google最具遠見、也最瘋狂的兩筆賭註:一是自研晶片 TPU,二是收購 DeepMind。而連接這兩者的關鍵,則是 2023 年那場壯士斷腕般的組織變革。01 自研晶片TPU故事的起點,始於 2013 年Google內部的一次“數學恐慌”。彼時的Google坐擁全球最大的 CPU 資料中心。然而,工程傳奇 Jeff Dean 做了一個粗略的紙上演算:如果全球數億Android使用者每天只使用 3 分鐘的語音搜尋,Google現有的資料中心規模就需要翻倍。但在摩爾定律已現疲態的背景下,這在帳上根本行不通,因為僅電費和伺服器採購成本就能將Google的利潤吞噬殆盡。唯一的出路就是——改變計算架構。Google首席科學家 Jeff Dean於是,硬體負責人 Norm Jouppi 帶隊,在高度保密的狀態下,僅用 15 個月就完成了從設計到部署的急行軍。TPU(Tensor Processing Unit)誕生了。TPU v1 是一個極端的“偏才”,它砍掉了所有不需要的功能,專註解決一個問題,那就是——如何在有限的電力和預算下,跑模型(Inference)。深度學習(Deep Learning)聽起來高大上,但它在晶片內部干的最多的活其實是“矩陣乘法”。這就像你做一頓土豆主題的滿漢全席,雖然菜譜很複雜,但90%的時間其實都在切土豆絲(做簡單的乘法和加法)。CPU和GPU好比是博學的教授,雖然聰明但幹活“死板”,每切一刀都要跑一趟倉庫拿放土豆,時間全浪費在“跑路”(記憶體存取)上了;而TPU不用太聰明,它引入的“脈動陣列Systolic Arrays”就像是由 256 個切土豆工人排成的方陣——第一個人切一下,直接遞給身邊的第二個人,第二個人切完遞給第三個人……不需要頻繁跑倉庫就能被連續加工256次。正因為省去了大量無效的搬運時間,即使是2015年部署的 TPU v1,以 28nm 的老舊工藝和僅 40W 的功耗(就像一個燈泡),在推理性能上比當時輝達的旗艦 K80 GPU 快了 15-30 倍,能效更是高出 30-80 倍。這是Google的第一次隱秘勝利。TPU 在多層感知器MLP、時間循環神經網路LSTM、摺積神經網路CNN的計算效率上,顯著高於傳統的CPU和GPU也就是說,在外界還在搶購昂貴的 GPU 時,Google已經在用接近物料成本(BOM Cost)的價格,大規模部署自己的 AI 加速器。更關鍵的是,輝達的硬體毛利率高達 70% 以上,而Google自研 TPU 意味著它不需要繳納這筆昂貴的“過路費”。這為十年後,AI從“炫技”轉向“大規模工業化生產”時,Google擁有的極低邊際成本埋下了伏筆。02 最成功的投資 ——Deep Mind如果說造 TPU 是為瞭解決“算得快”的問題,那麼收購 DeepMind 就是為瞭解決“算什麼”的問題。差不多在同一時期(2014 年),Google擊敗 Facebook(Meta),以超過 6 億美元的天價收購了一家位於倫敦、沒有任何產品、只有十幾名員工的創業公司。站在今天看,如果沒有這筆收購,Google在 ChatGPT 的攻勢面前很可能會直接“猝死”。說回2014,當時,深度學習剛剛萌芽。Google內部雖然有 Jeff Dean 領導的Google Brain,但Google Brain的基因是“工程師文化”——他們想的是如何用 AI 最佳化搜尋排名、識別貓的視訊、提升廣告點選率。但DeepMind 的創始人Demis Hassabis不一樣,他從小就是一位天才,是前國際象棋神童,是一個神經科學家和遊戲設計師。他的願景與Google截然不同,甚至有些“瘋魔”:“解決智能,然後用它解決一切。”(Solve Intelligence, and then use it to solve everything else.)同為天才的拉里·佩奇(Larry Page)看懂了這一點——DeepMind 研究的不是某種“工程”,而是 通用人工智慧(AGI)。所以,從這個角度看,這筆收購的本質,是Google買斷了當時地球上最聰明的一群 AI 大腦。而且為了達成交易,Google甚至簽下了一份極其罕見的協議:成立“倫理委員會”,承諾DeepMind的技術永遠不用於軍事。這奠定了後來雙方長期“一國兩制”的基調。所以,我們看到收購後的前七年(2014-2021),DeepMind 實際上是Google供養在倫敦的“梵蒂岡”——神聖、高冷、且極其燒錢,要知道,DeepMind 長期處於虧損狀態(甚至一度單年虧損 6 億美元),而他們對Google的核心業務(廣告、雲、Android)幾乎沒有任何直接貢獻。好在這麼多錢砸下去還是能聽到個響的——2016 年,AlphaGo 擊敗李世石,宣告了深度強化學習(Deep Reinforcement Learning, RL)的勝利。可以這樣說,Google Brain 擅長“監督學習”(給資料打標籤,教AI 認圖,也是Meta花天價收購的Scale AI搞的那一套);而 DeepMind 擅長“強化學習”(讓AI在虛擬環境中自我博弈、自我進化)。請記住這一點:強化學習。因為這一技術路線的儲備,直接決定了後來 Gemini 能夠擁有強大的邏輯推理能力。03 組織合併 打通任督二脈現在,問題來了——為什麼Google擁有 DeepMind 和 Brain 兩大天團,還有自己的TPU,為什麼在 2022 年會被 OpenAI 打得措手不及?答案在於組織內耗。甚至可以說,Google在很長一段時間裡,是在“左右手互搏”——Google Brain(加州派):務實、工程導向,由 Jeff Dean 領導,他們發明了 Transformer,打造了 TensorFlow,致力於將 AI 塞進搜尋、翻譯和廣告裡賺大錢錢。DeepMind(倫敦派):學術、清高,由Demis Hassabis領導,他們追求 Nature 封面,致力於攻克圍棋(AlphaGo)和蛋白質折疊(AlphaFold),對商業化嗤之以鼻,每天想的是怎麼才能發《Nature》封面頭條。他,剛剛拿了諾貝爾獎,但去年公司虧損6000萬,英鎊……兩方不僅形而上的文化不一樣,形而下的“程式碼語言”都不一樣——Brain 團隊死守自己開發的 TensorFlow,儘管隨著版本迭代它日益臃腫;DeepMind 則嫌棄 TensorFlow,轉而擁抱更靈活、更適合科研的 JAX。目前AI領域主流的三種開發工具,各有其特點想像一下,一家公司的兩支頂級特種部隊,一支說英語,一支說法語,槍支彈藥(模型架構)也不通用,而且時不時兩邊互懟一下,這導致了嚴重的資源浪費。所以,當OpenAI的Ilya Sutskever(前Google員工)帶領團隊在 GPT 的道路上狂飆突進時,Google的兩支團隊還在為爭奪 TPU 的配額而明爭暗鬥。在和平時期,這種“賽馬機制”是創新的溫床,但在戰時,就是致命的拖累。Ilya Sutskever 於2015年從Google離職後加入OpenAI,成為其聯合創始人兼首席科學家,直至他2024年離開OpenAI2023 年 4 月,那是Google最痛苦的時刻,也是決定生死的轉折點。在 ChatGPT 發佈的第 140 天,Google終於按下了一個遲到多年的核按鈕:強制合併Google Brain與DeepMind,組建Google DeepMind (GDM),Jeff Dean 轉任首席科學家,不再負責行政管理;權杖交到了 Demis Hassabis 手中。這代表了Google高層極其冷酷的決斷:為了生存,必須把命脈交給更有野心的“倫敦派”。Google Brain 與 Deepmind合併,標誌著Google與OpenAI展開終極對決這場組織合併,終於打通了任督二脈,因為它不僅僅是程式碼的統一(Google放棄了 TensorFlow,全面轉向 JAX + XLA)更是工程主義”與“科學主義”的握手言和:Brain 提供了“身體”(極致的架構力):作為 Transformer 的發明者,Brain 團隊擁有地表最強的工程化能力。他們造出了最強壯的軀殼——他們知道如何建構兆參數的模型架構,並讓它在數萬張 TPU 上穩定運行數周而不崩潰。DeepMind 提供了“靈魂”(基於 RL 的學習法):這是被嚴重低估的一點。ChatGPT 的核心壁壘不僅僅是預訓練,更是 RLHF(基於人類反饋的強化學習)。還記得 AlphaGo 嗎?DeepMind 在圍棋上鑽研了十年的強化學習(RL)終於找到了最大的用武之地。他們將 AlphaGo 中用於“自我博弈”和“策略最佳化”的演算法,遷移到了大語言模型的後訓練階段(Post-training)。Google Gemini 1.5 發佈時,長上下文是模型的亮點之一於是很快在2024 年,Gemini 1.5 發佈。這是一個震撼業界的時刻:當時GPT-4的命門在於處理不了長文字(只能處理幾萬字),Gemini瞄準的正是這一點,一舉將上下文窗口(Context Window)拉升到了 100 萬 token,讓Gemini可以一口氣吃透《戰爭與和平》、一小時的視訊或整個程式碼庫。Google Gemini 1.5 的100萬Tokens的上下文窗口對同時期的其他大模型產品形成了壓倒性優勢04 戰時獨裁 降維打擊很多人以為這只是演算法的最佳化,其實這是Google積累了10年的、軟硬一體架構的降維打擊。在硬體端,Google在 TPU v4/v5 中祭出了大殺器:OCS(Optical Circuit Switches),這是一套由 MEMS 反射鏡組成的物理光路交換系統,具體技術咱不需要懂,只需要知道這給Google帶來了毀滅性的優勢:極低的延遲和無限的靈活性,這也是支援百萬級長文字的物理基礎。Google 建設的算力中心有了強大的硬體,還需要軟體來駕馭。OpenAI 在 GPU 上最佳化性能,往往需要工程師手搓 CUDA Kernel,難度極大。但Google的JAX配合 XLA(加速線性代數編譯器),讓研究員只需要寫出數學公式(Python 程式碼),XLA 編譯器會自動將其“翻譯”成 TPU 的機器碼,並利用 GSPMD(通用分片器) 自動將模型切分到數千個晶片上。這就是為什麼Google能在長文字上率先突破:因為他們的編譯器能比人類更高效地指揮光路和晶片,將百萬token的計算完美地平鋪在整個資料中心。話說回來,如果沒有做“統一”這一步,Gemini絕無可能誕生,Google也不可能翻盤。但我們不禁要問:為什麼像Google這樣一家擁有 18 萬員工、以官僚主義和行動緩慢著稱的巨頭,能如此迅速地完成這樣劇烈的、甚至可以說有些血腥的組織手術?首先,Google是的確害怕了,恐懼永遠都是改變的第一動力。平時Google的官僚做派,是因為核心業務太穩固了。但在 2022 年底,Google第一次看到了“死神”的影子。如果使用者不再點選藍色連結,而是直接問 AI,Google賴以生存的商業模式將瞬間歸零。這種對生存的絕對恐懼擊穿了所有的部門牆和審批流。更關鍵的是——“創始人模式”回歸。這是外界鮮少提及的關鍵。平時Google由職業經理人 Sundar Pichai 管理,他的風格是求穩與平衡,但要強行合併兩個互相看不順眼的山頭,職業經理人做不到,也不敢做。但創始人拉里·佩奇(Larry Page)和謝爾蓋·布林(Sergey Brin)回來了。兩位Google創始人拉里·佩奇(Larry Page)和謝爾蓋·布林(Sergey Brin)據報導,布林甚至親自去總部寫程式碼,其實不管公司發展到什麼階段,只有創始人才擁有“凌駕於 KPI 之上”的道德權威,可以直接下達命令打破利益格局。這種“戰時獨裁”,是Google能迅速掉頭的核心原因。最近謝爾蓋·布林(Sergey Brin)在回母校史丹佛演講中復盤了Google此段在AI比拚中的危機經歷視訊連結:https://www.youtube.com/watch?v=0nlNX94FcUE05 中局?終局?進入 2026 年,AI 的競爭已經變味了。如果說前兩年是比拚“誰的模型更聰明”(智力競賽),那麼未來三年將比拚“誰的推理更便宜”(價格戰),商業的本質回歸到了“電力公用事業”的邏輯。在Google的算力中心佈局規劃中,“太陽能+儲能+資料中心”模式展示了其改變整個行業的能源邏輯而這,正是Google等待已久的獵殺時刻。我們看看 OpenAI 目前的處境:它像是一個住在豪宅裡的高級租客,軟體上,依賴 Microsoft Azure;硬體上,依賴 Nvidia GPU。結果就是每一筆收入,都要被微軟抽成,還要支付給輝達高昂的硬體溢價。OpenAI 的毛利天花板被牢牢鎖死。再看看Google,它是這個星球上極少數擁有“全端主權”的玩家:從最底層的沙子(自研 TPU 晶片),到連接晶片的光纖(Jupiter 網路),再到編譯器(JAX)、模型(Gemini),直至最頂層的使用者入口(Search/Android),Google實現了從原子到位元的完美閉環。Google的TPU產品也在不斷迭代更新,最新的產品擁有更強大計算能力和更高的效率據 SemiAnalysis 估算,TPU 的單位總擁有成本(TCO)比同代 GPU 低 4-10 倍。這意味著,Google完全可以將 AI 推理的價格壓低到 OpenAI 的成本線以下,還依然有大把的利可圖。而且,隨著 AI應用滲透進生產力核心,使用者開始上傳整本幾百頁的財報、丟進去一小時的高畫質視訊會議記錄。而這種“長文字推理”是算力的黑洞,推理成本是隨著上下文長度呈指數級爆炸的,如果使用昂貴的 H100 GPU 來做這件事,那無異於“燒錢取暖”。但Google卻可以憑藉 TPU 大記憶體優勢和 OCS 的光互連,可以將這種“重推理”任務變成一種極其廉價的通用服務。這或許是Google處心積慮設下的一個局:它可以毫無壓力地培養使用者使用“百萬級 Token”的習慣,因為它是唯一的發電廠(TPU)和電網(光互連)擁有者。當 AI 真正變成像自來水一樣的基礎設施時,只有掌握水源和管道的人,才擁有最終的定價權。06 長期主義的勝利回望 2013/2014 年,當 Jeff Dean 在那張紙上寫下 TPU 的構想,當拉里·佩奇拍板買下 DeepMind 時,他們可能沒想到過程會如此曲折。Google確實犯過大錯:它曾傲慢、它曾內耗、它曾像個猶豫不決的官僚。在 2022 年被 ChatGPT 突襲的那個至暗時刻,這些錯誤差點讓這家兆帝國崩塌。但科技行業的競爭,從來不是百米衝刺,而是一場馬拉松。OpenAI 是一支驚才絕豔的特種部隊,憑藉先發優勢和微軟的裝備支援,打贏了登陸戰(ChatGPT)。但當戰爭進入相持階段,演變成拼後勤、拼工業體系、拼成本控制的總體戰時,Google這台龐大的戰爭機器終於顯露出了它的猙獰獠牙。Google的護城河,從來不是某個神奇的演算法——因為演算法總會擴散,模型總會過時。真正的護城河,是那些深埋海底的自有光纖,是那些日夜轟鳴的脈動陣列晶片,是那套統一意志的 JAX 軟體棧,以及十年前那兩次不計成本、看似瘋狂的下注。這給所有科技公司帶來了一個殘酷的啟示:在技術變革的浪潮中,真正的壁壘無法通過“買買買”建立,但唯有在那個無人問津的“前夜”,敢於在底層基礎設施與基礎科學上做最笨重、最昂貴的投入,並擁有在危機時刻自我革命的組織勇氣,才能在十年後的風暴中,笑到最後。 (TOP創新區研究院)
Fortune雜誌─Gemini正將Google創始人25年前的設想變為現實
25年前,Google(Google)聯合創始人賴利·佩奇對搜尋引擎的構想,與如今其人工智慧產品Gemini所能實現的功能驚人地相似。佩奇與聯合創始人謝爾蓋·布林共同創立了Google。自1998年公司成立至2001年,他擔任了首任首席執行長,隨後由埃裡克·施密特(Eric Schmidt)接任,施密特在該職位上任職了十年。Google創立時,搜尋引擎的概念仍相對新穎。Google憑藉其PageRank演算法將搜尋技術提升到了新高度。該演算法通過分析網頁間的超連結來對最佳結果進行排序,而非僅僅依賴關鍵詞匹配。佩奇當時表示:“當時的搜尋引擎並不真正理解那些頁面更重要。如果你輸入‘史丹佛’,得到的只是一些隨機提及史丹佛的頁面。這顯然行不通。”Google聯合創始人賴利·佩奇(左)與謝爾蓋·布林。圖片來源:Kim Kulish—Corbis/Getty Images短短幾年內,Google的創新使其從一個被AltaVista和雅虎(Yahoo)等市場巨頭碾壓的無名小卒,成長為真正的競爭者。到2000年,這家行業新秀已佔據25%的搜尋市場份額——這一進步顯著,但仍遠未達到如今90%的統治地位。佩奇稱,公司2000年的搜尋廣告收入為8000萬美元;而到了2024年,這一數字已接近2000億美元。然而,佩奇對Google及搜尋的未來懷有更宏偉的期望。他在2000年10月接受非營利教育機構美國成就學院(American Academy of Achievement)的一次近期被重新關注的採訪中表示:“人工智慧將是Google的終極形態。如果我們擁有終極搜尋引擎,它將能理解網路上的一切,精準知曉你想要什麼,並給出正確答案。而這顯然就是人工智慧——能夠回答任何問題,因為幾乎所有資訊都已存在於網路之中。”儘管他當時補充道:“我們現在離那還差得遠。”但Google近期升級的Gemini,或許是實現佩奇25年前願景最接近的一次。OpenAI在2022年底率先推出ChatGPT,搶佔了先機。隨後數月,Google匆忙推出了自己的大語言模型。2023年2月,Google發佈了Bard,之後將其更名為Gemini。Google在將AI融入搜尋方面也取得了重大進展。今年5月,Google重塑了其標誌性搜尋引擎,新增了一個名為“AI模式”的標籤頁,整合了Gemini功能。該模式不再僅僅提供連結列表,而是以自然語言直接回答搜尋問題。與此同時,ChatGPT正在取代至少一部分原本專屬於Google的查詢需求。憑藉Gemini的最新更新,Google或許已領先於競爭對手。據《華爾街日報》(Wall Street Journal)報導,行業基準測試顯示,Google這款旗艦大語言模型的新版本在性能上已超過ChatGPT及Anthropic的Claude等其他競爭者。上周,Google將其最新大語言模型Gemini 3 Flash版本,整合到了面向全球使用者的AI模式搜尋工具中。公司稱,其先進的推理能力將為使用者更複雜的問題提供更優質的答案。憑藉多模態推理能力,Google最先進的AI能夠在單次提示中,基於文字、圖像、音訊、視訊和程式碼進行解讀與推理。雖然它尚不能預測使用者需求,但其上下文窗口高達100萬個詞元(token),這意味著它能呼叫大量先前的資訊來生成對使用者查詢的回覆——尤其擅長處理冗長且微妙的提示。Gemini已不僅僅是一個被動的搜尋引擎,其代理執行使用者任務的能力也遠超以往版本。它可以在Google生態系統內協同工作,管理使用者的收件箱並行送郵件。在程式設計方面,這款大語言模型能夠即時“觀察”並在幾秒內給出後續步驟建議。Google宣稱,Gemini 3能在幾分鐘內幫助使用者將一個想法轉化為可運行的原型。儘管25年前佩奇將“終極搜尋引擎”描繪為一個遙遠的目標,但公司正逐步接近實現他的願景。(財富中文網)
驚!匿名交易員24 小時內狂賺115 萬美元,賭Google 搜尋榜單「否定票」套利
根據鏈上交易記錄及瞭解相關情況的人士透露,一名化名 AlphaRaccoon 的匿名交易員近期在去中心化預測平台 Polymarket 上,透過押注Google 年度搜尋趨勢相關合約,在不到24 小時內獲利約 115 萬美元。這位交易員大舉買進多項「年度搜尋量最高人物」及「搜尋量前五名人物」合約中的 NO 股(否定票),交易時點集中在 12 月3 日前後。當時,多名候選人物的搜尋熱度在外部資料中已基本明朗,但平台價格尚未完全反映這一趨勢。押注“NO股”,對象包括川普據觀察市場的分析人士稱,Google 年度搜尋榜單每年發佈時間固定、資料來源公開,因此市場參與者通常能在正式公佈前對結果形成較高預期。鏈上資料顯示,AlphaRaccoon 的NO股押注對象包括:Bianca Censor、教宗良十四世(Pope Leo XIV)、唐納川普。上述人物在全年均具備較高曝光度,但並不足以登頂年度搜尋榜單。隨著市場預期在年底逐步收斂,相關NO 股價格最終在結算前後靠攏 1 美元,帶來顯著套利空間。「一旦外部資料足以確定趨勢,而市場價格仍未同步,套利窗口就會出現。」一位瞭解交易邏輯的人士說。定價效率受關注:市場深度不足暴露弱點這筆短時間的大額獲利在預測市場社群引發討論。有參與者指出,Polymarket 在特定時段的價格發現速度偏慢,使得資訊更充分的交易者能夠捕捉到價格錯位。支持者認為,該行為符合預測市場透過交易推動價格收斂的機制,有助於整體提高市場效率。但批評者則稱,該平台部分市場流動性不足,相較傳統金融市場,價格對外部公共資訊的反應往往存在滯後,使得專業交易者可以在關鍵節點取得不對稱優勢。監管關注度上升隨著2025 年Polymarket 交易量較去年同期顯著成長,其參與者結構也正向專業化傾斜。年度搜尋趨勢等公共資料賽道成為平台最受關注的類別之一。業內人士表示,隨著預測市場規模擴大,監管關注也上升。監管機構可能會重點考察:此類合約是否涉及未註冊的衍生性商品屬性,大額集中押注是否會影響市場完整性,平台是否具備充分的透明度與審查機制。目前尚無監管部門就此事件作出表態。預測市場的專業化趨勢正在加速儘管Polymarket 上的大額獲利案例並非首次出現,但AlphaRaccoon 的快速套利再次凸顯預測市場正朝更專業化方向發展。公共資料節點、流動性結構、價格反應速度等因素,正成為能否取得效益的關鍵。隨著更多資金與專業交易策略進入該領域,預測市場正從「群體智慧平台」轉向更接近金融市場結構的形態演進。 (北美商業見聞)
GPT-6、AI CEO 與AI最大風險 | Sam Altman最新萬字對話
近日,OpenAI 首席執行官 Sam Altman在美國The Progress Conference會場接受了經濟學家 Tyler Cowen 的訪談。本次對話中,雙方圍繞 OpenAI 近期驚人的營運效率、硬體(晶片)戰略、下一代大模型 GPT-6 的核心突破、AI 商業化的未來形態、全球算力與能源的佈局等關鍵話題展開了討論。Sam Altman 明確指出,GPT-5 隻是在科學研究上展現了“微光”,而GPT-6 有望在“科學發現”領域實現從 GPT-3 到 GPT-4 規模的巨大飛躍。Altman表示他正在以“AI CEO 最終將比我本人營運得好得多”為終局,倒推 OpenAI 的組織架構設計。Altman 認為當前的辦公套件催生了“虛假工作”。未來的工具將是 AI Agents 驅動的全新版本,AI Agent 之間會直接協同,只在必要時才上報給人類。相比“壞人利用 AI”或“AI 覺醒”,Altman 提出了一個更隱蔽的風險——AI 的“無意識接管”。即一個統一的模型在與全人類的持續共同進化中,無意圖地、巧妙地讓全人類信服了某件事,從而意外地“接管”了世界。此外,Altman 承認未來可能嘗試廣告,但他強調 AI 服務的核心是“利益一致”。如果 AI 為了“回扣”或廣告(如 Google 搜尋)而犧牲了答案的最佳性,將毀滅使用者與 AI 建立的信任關係。01 OpenAI 的營運飛輪:效率、硬體與未來工具OpenAI 近期達成了大量合作並行布了新功能(如 Pulse),活動範圍遍佈全球。你是如何在原有的高效率基礎上進一步提升,完成所有這些工作的?你們現在更多地涉足硬體(包括消費裝置和晶片),招聘或授權優秀的硬體人才,與招聘你擅長的 AI 人才相比有何不同?硬體世界中必須抓住才能成功的“無形差異”是什麼?你們是否正在把以往招聘 AI 人才的模式擴展到硬體領域?此外,有傳言稱 OpenAI 內部很少使用電子郵件,而嚴重依賴 Slack。為什麼電子郵件對你們是糟糕的?你們內部距離實現一個取代現有的辦公生產力套件的 AI 驅動新工具還有多遠?鑑於 OpenAI 的人力資本極其寶貴,為什麼這件事不應該成為一個優先事項呢?Sam Altman: 我認為沒有單一的秘訣,非要說的話,那就是人們對自己時間分配的實際情況,幾乎總是沒有自己想像的那麼好。隨著你面臨的需求和機遇越來越多,你總能找到方法持續提升效率。我們得以招聘和提拔優秀的人才,我把大量工作授權給他們,讓他們放手去做。這是我所知道的唯一可持續的方式。我確實在努力確保,隨著我們要做的事情日益聚焦,我能真正理解我們的核心任務是什麼。正如你提到的,現在有大量的基礎設施需要建設。從某種意義上說,任務反而變得更清晰、更簡化了。這很有幫助。我也不太確定。我想另一大變化是,世界上有更多人願意與我們合作,這讓商業談判的推進速度也變快了。(關於硬體戰略與團隊) 一個不同點是,硬體的周期時間要長得多,資本投入也更密集,而且試錯成本高昂。因此,我傾向於花更多時間去瞭解這些人,然後再決定:“好吧,你來負責這件事,我相信你能搞定。” 除此之外,基本理念是相通的。你都是在尋找那些優秀、高效、行動迅速的人才,明確目標,然後放手讓他們去做。(關於硬體世界的無形差異)我不知道這最終是好是壞,但我們的晶片團隊感覺更像是 OpenAI 的研究團隊,而不是一家傳統的晶片公司。我認為這或許會帶來非常好的結果。(關於擴展AI招聘模式)是的,雖然有一定風險,但我們正在(將AI招聘模式擴展到硬體)這樣做。(關於內部工具與未來辦公)我同意電子郵件很糟糕。但我不知道 Slack 是否就好,我懷疑它也未必。我認為電子郵件非常差勁,要做出一個比它更好的工具,門檻並不高,而 Slack 確實比郵件好。如你所見,我們同時在推進大量工作,並且必須極速行動。OpenAI 絕對是一個節奏飛快的組織。Slack 有它的好處,但我也很怕每天早上第一個小時和睡前最後一個小時,我得處理海量的 Slack 資訊,而且我認為它確實催生了很多“虛假工作”。我猜想,是時候建構一種全新的工具了。它將取代現有的辦公生產力套件,無論是文件、幻燈片、電子郵件還是 Slack。它將是 AI 驅動的全新版本。我指的不是那種糟糕的外掛,比如你不小心點錯地方,它就跳出來幫你寫整篇文件或總結資訊流;我指的是一個真正的版本,你信任你的 AI Agent,我也信任我的 AI Agent,我們讓它們去協同解決大部分事務,只在必要時才上報給我們。我認為,這樣一個觸手可及的優秀解決方案,可能終於要被開發出來了。(關於內部研發距離)很遠。但我猜,這只是因為我們還沒真正投入精力去嘗試,而不是因為模型本身的能力還差很遠。(關於為何不是優先事項)或許我們是應該做。但是人們容易陷入固有的工作方式,而且眼下很多事情都進展得非常順利,所以要啟動一個全新的大項目,需要克服很大的“啟動能量”。02 GPT-6 可能真的能做到科學發現GPT-6 對你而言,特殊在那裡?假設我管理一個科學實驗室,如果我現在就拿到了 GPT-6,第二天早上我具體該做什麼?你認為科學實驗室今年內有可能用上 GPT-6 嗎?Sam Altman: 如果說 GPT-3 是你第一次瞥見 AI 彷彿通過圖靈測試的曙光;那麼 GPT-5 就像是 AI 從事新科學研究的第一次閃光。雖然還很微弱,但時不時有人發帖說,“哦,它搞懂了這個問題”,或者“它提出了這個新想法”,或者“它在這篇論文裡是個有用的合作者”。GPT-6 則有機會實現一次從 GPT-3 到 GPT-4 規模的飛躍,但這次是針對科學發現領域。GPT-5 隻是微光閃爍,而 GPT-6 可能真的能做到了。(關於為GPT-6做準備)這總是個很難回答的問題。即使你知道它要來了,我想你首先會做的,就是把你正在苦苦思索的研究問題輸入進去,也許它會回覆,“這裡有個新思路”,或者“去試試這個實驗”,或者“去做另一件事”。(關於GPT-6上線時間)今年不行。03 “AI CEO”終局如果我考慮的是重組整個組織,讓 GPT-6 或 7 成為核心,我應該在組織層面做些什麼?你認為 OpenAI 的某一個重要部門實現 85% 由 AI 營運,還需要多久?你覺得什麼時候可以說:“好了,AI CEO 先生,你來接管吧”?我認為兩年半內會出現由兩三個人加 AI 營運的十億美元級公司,你的預測呢?你們在招聘大量聰明人時,是否會評估他們對 AI 的牴觸情緒?你具體在觀察什麼特質?Sam Altman: 相比科學家,我更多是在公司的背景下思考這個問題,因為我對此更瞭解。我對此非常感興趣,因為如果 OpenAI 不能成為第一家由 AI CEO 營運的大公司,那我會感到很慚愧。不,是全部。嗯,但它最終會接管全部,對吧?所以我們可以基於這個終局, 試著倒推回來。我發現這是一個非常有趣的思想實驗:要實現“AI CEO 營運 OpenAI 比我本人做得好得多”,需要滿足那些條件?這在未來某天顯然會發生。我們該如何加速這一處理程序?障礙是什麼?我發現這個思想實驗對於我們該如何逐步設計組織架構,以及預判未來會遇到的其他環節和阻礙,都極有幫助。我猜想,營運科學實驗室的人也應該嘗試用同樣的方式思考,他們會得出不同的結論。(關於AI營運部門時間)任何一個單一部門?幾年之內,一個很小的個位數年份,不會太久。就算我能假扮成一個政治家(雖然這不是我的強項),AI 也能做到。假設我繼續負責處理所有對外事務,只讓 AI 來實際做出正確的決策、規劃方向。(關於AI營運公司預測)我同意你的所有觀點。我認為 AI 甚至能更早做到這一點。而且我認為這對社會和未來是好事,不是壞事。但人們對其他人的信任遠超 AI,即使這種信任並不理性。比如 AI 醫生明明醫術更高,但你還是想要人類醫生。我認為社會可能需要更長的時間才能真正適應 AI,組織內部的人員也需要時間適應。但在大多數事務的實際決策上,AI 可能很快就會做得相當出色。(關於應聘人員的AI牴觸情緒)不,我確實會問相關問題。一個重要的指標是他們現在如何使用 AI。如果有人仍然說:“哦,是的,我用它來輔助 Google 搜尋,別的沒了。”這不一定構成淘汰理由,但這算是一個“黃燈”訊號。而那些真正在嚴肅思考“三年後我的日常工作會變成什麼樣”的人,這就是“綠燈”訊號。很多人其實並沒這麼想,他們只是覺得,“哦,是的,AI 以後會很聰明。”04 AI 的“保險人”核電站的保險是由政府提供的,因為即使它很安全,人們也總是過度憂慮。你是否擔心 AI 公司未來也會如此,由聯邦政府充當你們的“最後手段保險人”?我們擔心的是政府會成為“第一手段”的保險人,這是我不希望看到的。我們在 Intel 和稀土等案例中看到,政府正在成為股權持有者。在知道這已成為美國經濟的一種可能選項後,你如何為 OpenAI 規劃?Sam Altman: 在某種程度上,當一件事情的體量變得足夠巨大時,無論書面上如何規定,聯邦政府實際上都扮演著“最後手段的保險人”的角色,正如我們在歷次金融危機和保險公司搞砸事情時所看到的。考慮到我預期的 AI 將帶來的巨大經濟影響,我確實認為政府最終會成為最後手段的保險人。但我理解的“最後手段”和你所指的可能不同,我不認為他們會像對待核能那樣,真正來為我們制定保險條款。我也不希望那樣,而且我認為這不會發生。(關於政府成為股東)我幾乎不認為在 AGI 之後的世界裡,人類會失去所有意義,因為 AI 把一切都做了。我認為我們非常擅長尋找新的事情來做,新的遊戲來玩,找到新的方式服務彼此、相互競爭、獲得滿足感。但我確實認為,“社會契約”極有可能必鬚髮生重大改變。我不知道那會是什麼樣子。我能預見政府會更多地介入其中,並因此對 AI 公司提出強勢意見嗎?完全可能。但我們目前不是那樣運作的。我們只是試圖在現有的資本主義體系下開展工作。我相信這些事應該由公司來做,而不是政府,儘管我們會與政府合作,努力成為好的協作者。但我不想讓他們來為我們制定保險單。05 AI 服務的商業化使用者已開始使用 GPT-5 等模型處理複雜的現實任務(如旅行規劃),但 OpenAI 似乎並未從中捕獲相應價值。這個由 AI 驅動的新商業世界將如何運作?Sam Altman: 在回答這個問題之前,我想先拉遠一步看。我們很早前就注意到一個不同尋BC的現象,當時 AI 的問題還更嚴重,但 ChatGPT 總是被使用者評為“最受信賴的大型科技公司技術產品”。我們其實不認為自己是大型科技公司,但姑且算是吧。這表面上很奇怪,因為 AI 恰恰是那個會產生幻覺、充滿錯誤的東西。這背後是什麼原因呢?Google 搜尋上的廣告,是依賴於 Google 的搜尋結果不夠好。如果它直接給了你最佳答案,你就沒理由去點上面的廣告。所以你會覺得:“那個工具和我的利益不完全一致。”ChatGPT,無論它是否給出了最佳答案,你付費了,它至少在努力嘗試給你最好的答案。這使得人們與 ChatGPT 建立了一種深度且頗為信任的關係。你會向 ChatGPT 詢問最好的酒店,而不是去用 Google。如果 ChatGPT 接受了賄賂,把一家更差的酒店排在一家更好的酒店前面,這對你和 ChatGPT 之間的信任關係將是毀滅性的打擊。但換個角度,如果 ChatGPT 向你展示了它猜測的最佳酒店,然後你通過一鍵點選預訂了,它從中收取的佣金和其他酒店預訂平台一樣,並且這個過程沒有任何人為排序干擾,只是收取一筆交易費,我認為這就完全沒問題。我們最近推出的商業功能,其核心精神正在於此。未來我們也會在旅行服務上應用這套邏輯。我擔心的不是“回扣”,而是佣金上限。你將如何與那些在 GPT 找到最佳方案後、僅執行預訂的低成本 agent 競爭?如果競爭對手能以極低成本攫取佣金,你將如何支付智能化模型高昂的固定成本?Sam Altman:關於這一點,我總的一個看法是,我相信大多數商品和服務的利潤率將會大幅下降,包括酒店預訂這類服務。我對此樂見其成。我認為經濟中存在很多類似稅收的額外成本,它們簡直是拖累,能降低這些成本對各方面都大有裨益。我認為像 OpenAI 這樣的大多數公司,即便利潤率較低,反而能賺更多錢。我認為讓世界上最智能的模型實現商業變現的方式,肯定不是靠酒店預訂。我想探索新科學,並找出一種只有最智能模型才能實現的變現方式。確實有一個問題,很多人問過:“OpenAI 到底該不該做 ChatGPT?為什麼不乾脆去建構 AGI?為什麼不去研究治癒所有疾病的方法、核聚變、廉價火箭,以及所有那些東西,然後僅僅授權那些技術就行了?”這個問題問得不無道理,因為我相信那些才是我們最終會做的、最重要且最賺錢的事情。但我對事情進展的設想,或者說世界如何極大改善的最可能路徑,是我們把一個真正卓越的超級智能交到每個人手中。我們讓它變得超級易用,無縫整合。我們為你打造精美的裝置。我們將它連接到你所有的服務上。它會在你的人生中不斷瞭解你,為你處理所有事務。我們投資基礎設施、晶片、能源以及所有相關的一切,讓它變得極其充裕和極其廉價。然後,你們所有人會去探索如何讓世界變得更美好。也許有些人永遠只會用它來預訂酒店,不做他想,但很多人會發現他們能做的事情越來越多,從而建立新的公司、新的想法、新的藝術等等。也許 ChatGPT、酒店預訂或其他任何業務,並非我們賺錢的最佳途徑。事實上,我敢肯定它們不是。但我確實認為,做這些對世界而言是一件非常重要的事情。我很高興 OpenAI 能做一些並非以經濟利益最大化為目標的事情。目前,你們正與 Walmart 合作,你認為 Amazon 會屈服並加入,還是會奮起反擊?廣告對於 OpenAI 會是多重要的收入來源?頁面上的廣告會是什麼樣子?關於“這波熱潮不是泡沫”的最佳論點是什麼?Sam Altman:我不知道。如果我是他們,我會反擊。(關於廣告)同樣,有一種廣告我認為會非常糟糕,就像我們之前談到的那種。但也有些類型的廣告,我認為做起來會非常好,或者相當不錯。我預計我們會在某個時候嘗試廣告。但我並不認為這是我們最大的收入機會。頁面上的廣告會是什麼樣子?我不知道。你之前問了一個關於生產力的問題。我非常擅長不做我不想做的事情。我們有世界頂級的專家負責我們的產品策略。我以前也做過,花了很多時間思考產品。現在她在這方面比我強得多。我有其他事情要考慮。我相信她能處理好。(關於“不是泡沫”的論點)我有很多想說的論點,但從智識角度看最有趣的一個是:我們根本不知道超越人類水平的智能能走多遠,以及當它實現時,你能用它做什麼。大家已經提出了各種各樣的論點。而我更希望看到人們討論的是:“我們究竟該如何思考遠超人類的智能及其帶來的經濟影響?”06 全球佈局:AI、文化與無形知識OpenAI 正在與沙烏地阿拉伯、阿聯等國談判。OpenAI 的高層管理人員需要瞭解或理解那些國家的那些無形知識(如法律規範、交易期望)?你們是如何去瞭解的?是會問 GPT-6,還是會請三位專家來?你認為 GPT-6 在傳授你這些隱性知識方面能有多出色?你們有針對這方面的評估嗎?GPT-6 的詩歌創作能力會有多強?我估計一年之內能達到中等水平,但達不到頂尖。一首 7 分的詩和 10 分的詩之間差距是巨大的,我擔心你們依賴評分指南來訓練,反而可能阻礙你們達到 10 分。Sam Altman:這取決於我們和他們合作的具體內容。在一個國家建立資料中心、接受一個國家的投資,或是部署商業服務,這些與我們能想像的其他一系列合作截然不同。但總的來說,如果要在某個國家建立資料中心,我們需要瞭解誰來營運它。我們自己不營運資料中心,可能是 Microsoft、Oracle 或其他公司。我們將在那裡部署什麼樣的工作負載?我們會存放那些模型權重?安全保障機制是怎樣的?我們確實希望在世界各地與許多國家合作建設資料中心,而這些問題,正是我們與其他國家打交道時的主要考量。如果我們,雖然目前沒有這個計畫,要為某個國家開發定製模型,那我們會有更多的問題。(關於如何理解文化)我們會請專家。我們會和美國政府進行大量溝通。我們會請專家。再說一次,如果我們只是建設一個資料中心,由一個非常值得信賴的夥伴來營運,我們清楚知道工作負載是什麼,而且它的建設標準就像美國大使館或軍事基地那樣,那麼我們面對的問題,就與我們尚未決定要做的其他事情截然不同。如果是後者,我們會請更多的專家。(關於GPT-6傳授隱性知識)我不認為 GPT-6 能掌握那些隱性知識。它也許會給我們驚喜,但如果我因此覺得 “哦,不再需要和專家交談了”,那將是非常出乎意料的。(關於評估)實際上,對於非常接近的東西,我們確實在做。我不想提前透露。對於那一類事物,我們確實有評估方法。(關於詩歌創作)你認為 GPT-5 的詩歌創作能力有多強?我正想說,我不想特指 GPT-6 還是 7,但我認為我們會達到一個水平,讓你覺得:“這離頂尖水平不遠了,就像一個真正詩人寫出的還不錯的詩。”(關於 10 分詩歌)我認為我們能達到 10 分,但你到時不會在意。你會在意的是這項技術成就,但就人類創作的偉大藝術、情感和其他一切而言,你非常關心的是“人”,是它由一個人創作。對 AI 而言,僅憑技術指標寫出 10 分的作品,這固然了不起。我常用的一個經典例子是:最頂尖的國際象棋棋手,並不真的在乎 AI 下棋比他們強得多。這並不會打擊他們下棋的積極性。他們並不真的關心 AI 更強這件事。他們真正關心的是擊敗另一個人,他們痴迷於坐在對面的那個對手。AI 更強?他們不在乎。觀看兩個 AI 對弈,看久了其實沒那麼有趣。(關於評分指南的擔憂)評估可以依賴很多東西,包括你如何判斷什麼是 10 分,什麼不是。你可以在過程中閱讀大量文字,並提供一些即時訊號。這就引出了一個非常有趣的觀點:假設你寫不出 10 分的作品,但你能判斷什麼時候某樣東西是 10 分。這也許就是我們所需要的全部。(關於人類集體決定)即便如此,我們依然可以做到。也許我們的判斷力不是很好,因為它與歷史相關,並且會隨時間漂移——有些我們一致認為偉大的東西,下一代可能並不認同,諸如此類。但是,無論人類用什麼過程來判定那首詩是 10 分,你都可以想像,這個過程能為 AI 提供某種訊號。當然了,如果你知道那是 AI 寫的,你可能又不在乎了。我們在 AI 藝術領域已經看到了這種現象。07 晶片、算力與能源如果你們最終決定自己製造晶片,最困難的部分會是什麼?為什麼我們不直接製造更多的 GPU?最終的制約因素是什麼?如果你能多擁有一種東西來獲取更多算力,你希望是那一種?最可能的短期解決方案是什麼?Sam Altman:那整件事都非常難。沒有那個部分是容易的。不,我來告訴你為什麼。人們談論了很多關於 AI 研究的遞迴自我改進循環:AI 幫助研究人員——也許現在只是更快地編寫程式碼,但最終會實現自動化研究。這一點大家已經很理解,討論得非常多了。但很少被討論的是這對硬體的影響:能製造其他機器人,能建造其他資料中心的資料中心,能設計自己下一代產品的晶片。製造晶片有很多困難環節,但也許其中許多環節會因此變得容易得多。也許晶片設計問題,對於上一代晶片來說,是一個非常適合解決的問題。(關於製造更多 GPU)因為我們需要製造更多的電子。(關於制約因素)我們正在非常努力地解決這個問題。(關於最希望擁有的)電子。就是能源。(關於短期解決方案)短期內是天然氣。在美國南部?Sam Altman:或者任何地方。但長期來看,我相信,能源將由聚變和太陽能主導。我不知道兩者確切的比例,但我認為它們會是最終的贏家。你仍然看好聚變?是否擔心只要它還被稱作核能,人們就會非理性地拒絕它?你是否擔心過這樣一種情景:最終,超級智能並不需要那麼多的算力,而你們現在對算力的投資,像是在與未來 30 年的演算法進步對賭?Sam Altman:(關於聚變)非常看好,同時還有太陽能。(關於“核能”稱謂)Sam Altman:我提到“核”這個詞了嗎?你是經濟學家,我不是。但我認為,在給定的安全水平上,總會存在某個價格點,使得市場對這種能源的需求是壓倒性的。如果它和天然氣價格一樣,也許推廣起來會很困難。但如果價格是天然氣的十分之一,我想我們都會同意它將迅速普及。我不知道這個價格的臨界點到底在那裡。(關於算力需求過剩)這相關的一個問題是,就像人們總是希望能源越便宜越好一樣,我認為人們也總是希望算力越便宜越好。即使未來你能用更少的算力製造出極其智能的模型,我確信可以,人們還是渴望以各種新方式去消費,用更充裕的智能去做更多事情。這個賭注我每天都願意下。我真正擔心的相關問題是,我們實現計算的方式發生了巨大的範式轉變,而我們都在一個死胡同裡追逐。那將非常糟糕。那會是什麼樣的情景?Sam Altman:我不知道。比如我們全都轉向了光計算,完全的光計算之類的。那豈不是必須從頭再花一大筆錢?Sam Altman:不全是。能源還是能源,但在其他所有事情上都得重來。我很喜歡 Pulse,為什麼我沒怎麼聽到關於 Pulse 的討論?你用 Pulse 來做什麼?Sam Altman:人們喜歡 Pulse,但它目前只對我們的 Pro 使用者開放,這個群體並不大。而且,我們目前每天給使用者的內容也不多。這兩點我們未來都會改變。我猜,等我們向 Plus 使用者全面推出時,你就會聽到更多關於它的討論了,但人們確實很喜歡它,評價很高。我現在的生活裡只有兩件事:家庭和工作。顯然,這就是我跟 ChatGPT 聊天的主要內容,我從中獲得了很多相關資訊。我偶爾也會收到像“新款超級跑車發佈了”或“這裡有條很棒的徒步路線”之類的資訊,但絕大部分都是關於那兩件事的。它在這兩方面都做得很好。08 AI 的“無意識接管”比“覺醒”更可怕如果讓你用 10 億美元振興聖路易斯,你會怎麼做?AI 似乎高度聚集在灣區,試圖把 AI 弄到聖路易斯去,這是正確的做法嗎?把一個無人歸屬、無法追蹤的 AI Agent 釋放到野外,這應該合法嗎?如果它從一個國家租用雲端運算資源,我們能做什麼?Sam Altman:10 億美元,而且我還願意投入我個人的時間?這不是一個多有深度的答案,因為我不認為這件事可以被普遍複製,但對我個人而言,我能做的是:我想我會嘗試在聖路易斯啟動一個類似 Y Combinator 的項目,吸引一大批專注於 AI 的初創公司創始人搬到那裡,創辦一堆公司。(關於 AI 聚集)這就是為什麼我說這是“對我個人而言”獨特的事情。我覺得我能做到。也許這想法天真得無可救藥。(關於無法追蹤的 AI Agent)我認為這是個門檻問題。我不認為你會主張大多數系統都需要任何監督、監管或法律問題之類的。但如果我們有了一個 AI Agent,它很有可能在網際網路上大規模自我複製,並且捲走銀行帳戶裡所有的錢,或者做諸如此類的事,那你就會說:“也許 這個 需要一些監督。” 我認為問題在於,你把需要監管的門檻劃在那裡。我們現在是如何處理做類似事情的人的?我還不知道正確答案,但我不成熟的看法是,我們應該立即去解決那些人類利用流氓網際網路資源作惡的問題,而 AI 只會讓這個問題變得更糟。AI 也會帶來更好的防禦。我發現自己向 GPT-5 提問的答案很有趣,但別人分享的答案卻很無聊。這是否意味著融合社交媒體和 AI 這件事有根本性缺陷?Sam Altman:不,我也有同感。我也不想看你跟 GPT-5 的聊天記錄。我相信,我也相信你不想看我的記錄,但它們對我來說很棒。我認為 ChatGPT 在很大程度上是一種單人遊戲體驗。但這不意味著沒有一些有趣的、新型的社交產品可以被創造出來。事實上,我非常確定是有的,但我認為那不是“分享你的 ChatGPT 聊天記錄”。AI 視訊那個目前做得不錯。很明顯,人們喜歡自己創作,但也喜歡看別人用 AI 生成的視訊。不,我認為,當你我以及其他所有人都擁有了能代表我們做事的、非常出色的個人 AI Agents 時,我們現在看到的這些東西,都不是你能想像到的那種真正有趣的東西。到那時,可能會有全新的社會動態值得思考。ChatGPT 目前的物理形態(螢幕上的文字框)會基本保持不變,還是 13 年後會變成一個完全不同的“怪物”?人們如此頑固地熱愛在文字框裡打字,這難道不令人驚訝嗎?Sam Altman:我們正努力為你製造一種新型電腦,它會有一個專為 AI 設計的全新介面。我認為 AI 需要的介面,與我們過去 50 年一直在使用、且目前仍陷於其中的計算範式完全不同。AI 是對“可能性空間”的一次顛覆性改變。很多你如何使用電腦的基本假設——比如你是否還需要一個作業系統、是否還需要打開一個窗口,或者是否還需要手動傳送一個查詢——這些現在都成了問題。我得承認,那些聲稱要發明一種新型電腦的人,過往的成績都非常糟糕。但如果非要賭一個人能做成,我認為 Jony Ive 是一個可信的人選,也許是你能下的最好的賭注。我們拭目以待它是否能成。我個人非常興奮能去嘗試。(關於熱愛打字)發簡訊、命令列、搜尋查詢——那是我最喜歡的介面。嗯,很多人都在用。人們熱愛發簡訊。人們喜歡 ChatGPT。我記得當初我們在考慮 ChatGPT 的介面時,我非常篤定,這種介面會是人們熟悉並且願意使用的。我想,我是作為“網際網路之子”長大的,我堅信那才是網際網路該有的樣子。在我十幾歲的時候,發簡訊就是我的生活。未來兩三年內,你與高等教育機構最理想的合作方案是什麼?未來 5 到 10 年,大學學位的回報會發生什麼變化?Sam Altman:我懷疑整個教育模式都應該改變,但我不知道該變成什麼樣。我認為理想的合作關係,應該是我們去嘗試 20 種不同的實驗,看看那種能帶來最好的結果。我一直饒有興趣地觀察那些 AI 學校如雨後春筍般湧現。似乎很多採用截然不同方法的學校,都取得了積極的成果。我認為理想合作關係的頭幾年,就應該是我們去進行 20 種截然不同的實驗。(關於大學學位的回報)它的價值歷史下降率是多少?我猜它價值下降的速度會比過去十年快一點,但它不會像大家想像的那麼快就崩潰歸零。五年後,一個“普通人”想學習如何更好地使用 AI,他們具體該做什麼?在並不遙遠的未來,你覺得你還會讀書,還是只會和你的 AI 互動?AI 將徹底顛覆你 23 歲時做的那一件文化習慣?Sam Altman:你是特指學習如何 使用AI 嗎?我笑了,因為我記得我小時候 Google 剛出來那會兒,我幹過一份工作,教老年人怎麼用 Google。那個過程讓我感覺他們簡直無法理解。就好像,我跟他們說:“你把詞輸進去,Google 就這樣做了。” 我對 AI 充滿希望的一點是,我認為 ChatGPT 增長如此之快的原因之一,就是它非常容易上手,並且能很快從中獲得真正的價值。教人們如何使用 AI?本周全球大概有 10% 的人會使用 ChatGPT,而這個產品三年前還不存在。我猜一年後,這個數字可能會變成 30%。人們一旦開始使用它,確實會發現越來越多、越來越複雜的事情可以用它來做。“如何教人”這件事,對我來說不是一個眼下最操心的問題。我相信人類的創造力,也相信人類在幾年時間裡對新事物的接受能力。(關於未來是否讀書)書籍在許多其他的技術變革中都倖存了下來。我認為書籍這種內容格式中,有一些非常深刻的東西得以延續。它非常需要“動腦”,姑且用這個詞吧。我懷疑未來會出現一種與一系列思想互動的新方式,在大多數情況下,它會比書更好。但我認為書不會消失,只是我敢打賭,在人們學習新知或與新思想互動的方式中,書所佔的比例會更小。(關於文化習慣改變)這個答案可能有點無聊,但我認為是我 工作 的方式——我處理電子郵件、打電話、開會、寫文件和應付 Slack,我預計這會發生翻天覆地的變化,這已經成為我工作日中一種根深蒂固的習慣和節奏。但至於花時間陪家人、親近自然、吃飯、和朋友互動——這些事情我預計幾乎不會改變,至少在很長很長一段時間內不會。AI 需要多長時間才能降低租金或房價?食品價格呢?醫療保健方面,AI 會讓它更貴還是更便宜?在一個被 AI 滲透的世界裡,我們是需要徹底地重新審視專利法和版權法,還是只做修改就行了?Sam Altman:我正想反駁“土地就是土地”這個前提。還有很多其他問題,我認為 AI 短期內也無法解決。也許會出現一些非常奇怪的次生效應,讓房價大幅下降,但遺憾的是,我不認為 AI 能很快直接解決這個問題。(關於食品價格)我賭它會下降。如果十年內還不下降,我會非常失望。(關於醫療保健)我賭我們會在醫療保健上花更少的錢。我敢說,對於當今存在的許多疾病,我們要麼能徹底治癒,要麼能找到非常便宜的療法。而目前,我們對待它們只有昂貴的慢性病管理方案,而且效果並不好。我賭醫療保健會變得更便宜。通過藥物、裝置,甚至包括實際醫療服務的交付方式。住房問題,對我來說是那個看起來超級棘手的問題。(關於專利和版權)我真的毫無頭緒。隨著 AI 驅動內容的井噴,有人認為需要重新審視第一修正案(言論自由),你對此有何看法?LLM psychosis (大型語言模型精神病) 這件事的嚴重程度如何?假設您現在可以請來一位專家,幫您解決一個您腦海中的實質性問題,那個問題會是什麼?Sam Altman:我沒多想,最近發了條推文,大意是我們將在 ChatGPT 中允許更多的言論自由。人們的反應如此激烈,真的很有趣。我們過去並不...這麼說也不完全公平。我們將允許比過去更多的自由。對我而言,一個非常重要的原則是,我們應該像對待成年人一樣對待我們的成年使用者。人們在與他們的 AI 互動時應享有高度的隱私權,這需要法律的變革。並且人們在使用 AI 時應該有非常寬泛的界限。我當時隨手發了那條推文...我真是大錯特錯了。我想,也許只是人們並不像他們自己所說的那樣,真正相信言論自由。每個人都認為,“我自己的言論自由,我能掌控。我需要它。我的想法都沒問題。但你的想法嘛——”(關於 LLM Psychosis)非常輕微,但並非完全不存在。這也就是為什麼我們通過設定一系列限制,惹惱了幾乎所有的使用者群體。那句“像對待成年人一樣對待成年使用者”其實有個附帶條件,那就是“像對待心智健全的成年人一樣對待成年人”。社會普遍認為,我們對待處於精神危機中的成年人的方式,應該和對待其他成年人有所不同。我們做了很多改動,而這些改動是與言論自由政策相衝突的。既然我們現在已經部署了那些心理健康緩解措施,我們將再次允許 ChatGPT 在創意模式、角色扮演模式或寫作模式中提供某些此類內容。我擔心的不是那萬分之幾接近現實感喪失、我們可能會觸發其精神崩潰的人,這個問題我們可以處理好。我更擔心的是,很有趣,有些話會一直留在你腦海裡。曾有人對我說:“永遠不要相信宣傳對你無效。他們只是還沒找到針對你的那個點。”在所有關於 AI 安全的討論中,我傾向於把大多數 AI 思想家分為兩派:一派擔心“壞人利用 AI 造成巨大傷害”;另一派擔心“AI 本身目標錯位、覺醒,然後故意接管世界”。還有第三類,一個很少被談及的類別,但我認為它更可怕、也更有趣,那就是 AI 模型“意外地”接管了世界。不是說它們會誘使你精神錯亂,而是,如果你讓全世界都和這同一個模型對話,它本身沒有任何意圖,只是在這個持續共同進化的過程中不斷從世界學習,它就只是巧妙地讓你信服了某件事。它沒有這個意圖,但它就是做到了。它以某種方式學會了。這顯然不像“聊天機器人精神病”那麼戲劇化,但我確實經常思考這個問題。(關於要解決的問題)我對這個問題剛好有一個現成的答案...我是從精神層面,而非字面意義上理解這個情景的。那一刻終將到來:超級智能被成功建構,它通過了安全測試,一切準備就緒。我們或許還能監督它,但它將開始做那些極其不可思議的事情。它將自我完善,它將向星際發射探測器等等。在你說“開始”之前,你有機會輸入第一條提示。問題是,你應該輸入什麼?您現在有初步答案嗎?Sam Altman:不,還沒有。我之所以腦中有這個現成的答案,是因為有個人即將去拜見達賴喇嘛,他對我說:“關於 AI,你想問什麼問題,我都可以幫你問。”我當時想:“這機會太難得了。”我為此冥思苦想,最終想到的就是那個問題。 (數字開物)
Google產品副總裁 :不是堆功能,是教 AI 理解人
2025 年 3 月,Google搜尋上線了一個新按鈕:AI模式(AI Mode)。它第一次把搜尋體驗,從輸入關鍵詞到點選連結,變成了持續對話,不只是回答問題,而是理解你為什麼問。到10月,AI 模式已覆蓋 200+ 國家/地區,支援 35+ 語言。資料顯示,使用者在AI模式裡提問的長度,是傳統搜尋的 3 倍。2025 年 10 月 11 日,Google產品副總裁 Robby Stein 接受了一場訪談。他反覆強調的,不是模型算力或技術路線,而是一個更本質的問題:我們不是上線更多功能,而是教 AI 理解人。這句話背後,是一次產品思維的轉向:未來 AI,不是更強大,而是更懂你。第一節|AI 模式不是聊天機器人,是“資訊理解系統”ChatGPT火了之後,很多人斷言:Google完了。理由很簡單:誰還願意點十幾個連結翻網頁?大家更想要一句話答案,或者直接和 AI 聊一聊。但Google產品副總裁 Robby Stein 的回應是:“我們不是做一個陪你聊天的機器人,而是在設計一個能理解你要找什麼的系統。”✅什麼是 AI 模式?它和你熟悉的搜尋不一樣Robby 介紹,AI 模式最早出現在搜尋入口的一個小按鈕上。 你點開它,看到的不是傳統的搜尋框+藍色連結,而是一個可以持續對話的介面。你可以提一個很長的問題,連續追問第二個、第三個。它會記住上下文,還能推薦關聯資源:地圖、官網、產品連結。這和“AI 概覽”有什麼不同?Robby 說,AI 概覽(AI Overview)只是在傳統搜尋結果前加一段AI總結,相當於給你一個快速答案;而 AI 模式(AI Mode)是一個完整的互動流程,是為解決任務而設計的入口。不是要改一個模組,而是建構一個新路徑。它是為資訊設計的,不是為了閒聊。✅ Google 做的不是生成,而是理解在 ChatGPT 裡,我們習慣說:AI生成了一段答案。 但在AI模式中,Google更在意的是:這個答案對你來說,是不是真的有用。比如你在計畫一次親子旅行,AI 模式不僅會給你推薦目的地,還會:顯示這些地點的步行距離;給出官網連結確認開放時間;把地圖嵌入進對話裡。Robby 用自己的親身體驗舉了個例子:我和女兒出行,我問了AI模式一次問題,它找到了所有相關的公園資訊、開放時間、步行距離和官網驗證連結。突然間我意識到,這不是搜尋引擎的加強版,而是一個新系統。他把這次經歷比作高爾夫球的完美一桿。那一刻你知道,它是真的幫到你了。第二節|AI 模式是怎麼被“教會”的?Robby Stein 說,AI模式不是 Google 高層拍板、全公司一擁而上搞出來的。 它最初,只是幾個人湊在一起的小項目,連名字都沒有。“最早團隊就 5 到 10 個人,有工程師、設計師,還有一個技術負責人。我們不是要把搜尋改造一遍,只是想看看,如果使用者能隨便提問,會發生什麼。”他們做的第一件事不是寫程式碼,而是搭了個 空白頁 :一個可以輸入問題、AI回答的原型介面,甚至連裝飾都沒有,只有游標。第一步:找到它真的有用的那一刻Robby說,那時候的目標很簡單:找出它有沒有幫上忙的那一刻。早期測試中,有使用者在搜尋框末尾手動加上“AI”兩個字,希望觸發更智能的回答。還有人拍下作業題的照片,問第二題怎麼做。這些行為讓團隊意識到:使用者已經在教搜尋引擎該怎麼進化了。Robby 說,這種早期訊號,比任何指標更重要。第二步:拉真實使用者,聽真實反饋接下來,他們把這個原型交給了 500 個測試使用者,大多是朋友、家人,還有一些內部員工。要求很簡單:你就當這是你用的新搜尋,出了問題直接截圖給我。“我有個朋友用得很認真,也批評得特別狠。他每天都截圖發我,說‘這個答得不對’、‘這句完全搞錯了’、‘這個資訊看不懂’。我很感激這些反饋,都是寶貴的。”他們沒有拉長項目周期,也沒有等產品成熟再投放。反而像一個創業團隊一樣,邊改邊用、邊試邊修。這些真實查詢,成了Google AI模式最初的訓練素材。Robby 用一句話形容這段過程: “你不能等一切完美才上線。你得先找到對的方向,然後把它打磨得更好。”第三步:放進Search Labs,觀察真實使用資料經過第一輪使用者反饋,他們終於發佈了公開測試版,放進了 Google 的 Search Labs 中。 這意味著:任何人都可以開啟 AI 模式,真實查詢。這個階段的目標變了:哪些問題使用者最常問?哪些問題回答得不好?使用者會不會繼續追問?什麼時候會退出頁面?所有資料都拿來反推:那裡需要改,那裡要刪,那裡值得保留。這個階段最關鍵: 只有使用者真正在用,你才能發現那塊是錯的。真正的最佳化不是團隊給模型講課,而是讓使用者的真實行為來教它怎麼改。第四步:分階段推向全球從最初的 5 人原型,到 Search Labs 上線,最後是正式發佈入口按鈕。 Google 沒有一次性上線全球,而是分階段測試、分國家擴展。為什麼這麼做?Robby 給出的答案很直接:“AI 模式不是一個模組,而是人們獲取資訊的方式。你不能冒險一下子給全世界的人都換了入口。”從 5 個人的空白頁,到覆蓋 200 多個國家的全球入口,Google 用了大約一年時間。 方法很簡單:先做出能用的版本拉真實使用者進來提問每一次反饋都當最佳化方向不是團隊定義 AI 該怎麼回答,而是使用者的真實需求在教它如何回答。第三節|做產品不難,難的是搞懂使用者真正要什麼Robby Stein 不止做 AI。他曾是 Instagram 的產品負責人,推出過Stories(24小時後消失的動態)和Close Friends(密友可見功能)但在這場訪談裡,他最願意講的,不是成功的那一款,而是最初失敗的那一個:“Close Friends 這個功能,做了兩三年,剛上線的時候,完全沒人用。”✅ 什麼是 Close Friends?為什麼最早沒人懂?這個功能是給你設一個密友列表。 你可以發一張 Story,只讓這些人看到,不想讓全網都看到你那點情緒、那張素顏自拍、那句吐槽。聽上去挺好對吧?可最開始它根本沒人用。為什麼?Robby 說:我們把它做成了一個什麼都能發的地方:Feed可以發,Story可以發,連你首頁上都有密友專屬內容。特別混亂。更糟糕的是,功能的名字叫 “Favorites”(最愛),很多人以為只能加一兩個最親近的人。 結果大家加了兩個人,一發 Story,對方也不一定回,沒人互動,尷尬至極。“我們希望的是讓人產生連接感,結果大家發了內容,卻沒有收到回覆。整個體驗就斷了。”✅ 真正的問題:不是功能不夠多,而是壓力太大Robby回憶說,他們後來做了一件事,重新去問使用者:你為什麼不發Story?得到的答案几乎都差不多:“我前任會看到。”“我老闆在關注我。”“有個愛評論我長相的朋友也在。”一句話總結:不是不想發,是怕發了之後"被錯的人看見"。這才是核心問題:使用者要的不是分享給特別關係的功能,而是一個沒有壓力的小圈子。✅ 他總結的三條產品原則第一個:搞清楚,使用者為什麼“僱用”你的產品Robby 用了一個經典比喻來解釋:“人們不是想要一台電鑽,他們是想要一個牆上的洞。”換句話說,使用者不是來用產品的,而是“雇”產品幫他們完成某件事。就像打開AI模式,使用者真正想要的不是"體驗AI",而是找一個能幫他們規劃行程、寫郵件、查東西的助手第二個:別只看資料,要找到那句“關鍵的話”資料能告訴你“點進來的人少了”“發內容的人掉了”,但真正關鍵的是那個“為什麼”。Robby 說,他們問一個使用者:你在什麼時候發了 Close Friends 的內容? 對方說:我那天很難受,想發點東西,但又不想讓大家看到。這句話成了產品設計的起點:不是展示自己,而是尋求回應。第三個:別太聰明,要讓人一眼看懂最初的版本是這樣:發 Close Friends 內容沒有標記;看的人不知道這是“只給我看的內容”;發的人也不知道有沒有人收到。後來團隊做了一個小改動,把Story圈圈的顏色改成綠色。 大家一眼就知道,這是只給密友的內容。這種“看得見”的設計,反而讓大家更敢發,更願意用。這段經歷深深影響了 Robby 後來做 AI模式的方式。他不再盯著功能清單,而是盯著一個問題:這個產品幫使用者完成了什麼?一個 AI 產品好不好,不看功能多花哨,而看它是不是真的理解了使用者想做的事。第四節|借鑑可以,但要做成自己的版本2016年,Instagram 推出 Stories 功能,幾乎所有人都說它在“抄襲 Snapchat”。負責這個項目的 Robby Stein 的回應是:“這個形式確實是 Snapchat 發明的。但我們關心的是:它能不能讓 Instagram 更好?不是所有好東西都要你發明,關鍵是讓它變成屬於你的版本。”✅ 為什麼 Stories 不是 Snapchat 的複製貼上?Robby 說,他們當時並沒有照搬 Snapchat 的做法,而是把這個形式 “重新做成 Instagram 的樣子”。舉幾個他提到的具體做法:Snapchat 不允許上傳已有照片,只能現場拍。 → Instagram 改了,可以上傳手機裡拍好的高畫質圖,因為很多人希望留住回憶。Snapchat 的 Story 播放不能暫停。 → Instagram 加了“長按暫停”功能,使用者可以慢慢看,不會錯過細節。Instagram 還加入了複雜濾鏡、霓虹畫筆、更多創意工具。 → 讓表達方式更豐富,也更適合 Instagram 原本就愛“修圖”的使用者習慣。這些不是技術創新,而是圍繞使用者場景做的選擇。如果使用者已經認定了一個產品該是什麼樣,你硬要把它掰成另一個樣子,基本上都會失敗。✅ 同樣的邏輯,也在AI模式上現在回到 Google 做 AI 模式這件事上。 很多人第一反應是:這不就是另一個 ChatGPT 嗎?Robby 的回應和當年做 Stories 一樣:我們不是在做 ChatGPT 的複製品。我們做的是:搜尋裡的 AI,用搜尋的方式來服務使用者。什麼意思?ChatGPT 很強大,但它是開放對話式的,你可能在它那裡寫詩、編故事、扮演角色;而 AI 模式,是圍繞“獲取資訊”這個任務來設計的。比如你搜尋“適合 6 歲孩子的科普展覽”,AI 模式會:先理解“6 歲”和“科普”的搭配含義;然後推薦適齡內容,還附帶地圖、票價和官網;最後你可以接著問:“這個周末有嗎?”“需要預約嗎?”這不是AI聊天,而是AI跟著你的問題走。Robby用“使用場景”來劃分界限:想寫封信、潤色文案、找靈感?ChatGPT很適合。要找地址、查展覽、對比資訊?AI模式更合適。“你不會把 ChatGPT 當成地圖,也不會用它確認一家餐館的開放時間。我們就專注做這些 ChatGPT 沒做好,但使用者非常需要的事。”從 Instagram 到 Google,從 Stories 到 AI 模式,Robby 的理念始終一致:借鑑別人的靈感沒問題,但要想清楚怎麼把它做成自己使用者需要的樣子。別人的使用者在意“有趣”,你的使用者在意“有用”,那就圍繞“有用”來設計。第五節|好產品不是最聰明的,而是最能聽懂你的在整個對話的最後,Robby Stein 回到一個特別基礎的問題:什麼樣的 AI 才算好?不是模型大不大、參數強不強,也不是能不能寫小說、寫程式碼。 而是一句話:它到底能不能理解你在問什麼?✅ AI 的核心價值:聽懂你在問什麼過去我們用搜尋,得先自己想清楚關鍵詞。 用 ChatGPT,也得組織好語言,再生成一下。但 Robby 說,AI 正在變得“更接近人類思維”。你想問什麼,直接開口就行,不用想格式,也不用擔心表達是否嚴謹。連孩子都能感受到這種變化:“我家小孩放學回來會說:'我能不能和Google聊聊?我想問問它斑馬喜歡吃什麼。'然後他們就打開Google,直接說出問題,開始對話。”✅ 這不是在用搜尋,而是在練習提問Robby 把這種現象稱為 AI 變成了好奇心引擎。以前,孩子要看百科全書,要找爸媽問問題;現在,他們第一反應是“去問 AI”。AI 的最重要變化,不是能寫得多複雜,而是讓提問這件事,變得特別自然。它不再是一個工具,而是一個可以被說話方式引導的對話過程。你說:“我周末想帶孩子去科學館,有什麼推薦?” 它會回問:“你們住在那裡?”、“更偏向自然類還是科技類?”、“需不需要提前預約?”這一來一回的過程,才是真正體現出 AI 模式與傳統搜尋的區別。Robby 還提到,團隊最近剛上線了一個新功能:Search Live。你在 Google App 裡打開它,就可以直接用語音對話式地搜尋。不用打字,不用翻連結,就像說話一樣和 AI 交流。他說:“這是最自然的學習方式,你只需要有一個問題,然後開口說出來。”✅ 學會用 AI,不是掌握技巧,而是敢於多問Robby 認為,AI 的未來,不是一個你得精通的人才能用的工具,而是一個連孩子都能用來提問的朋友。很多人低估了自己能通過 AI 學到多少東西。你只需要願意問。這不是技術的勝利,而是產品形態的進化。當 AI 變得聽得懂你說話,你才會願意更常用它,也才真正開始改變自己的學習方式。這也是 Robby 最看重的:“AI 能不能被使用者自然地拿來提問,提完以後真的得到幫助。只要它有一次真正幫到了你,那你可能就不會離開它了。”結語|你不是在用 AI,而是在教它理解你這一輪 AI 競爭,看上去是模型參數、處理速度、訓練成本的比拚。但 Robby Stein 看到的是另一條路:不是功能越多越好,而是要教 AI 理解使用者的需求。Google 在做的不是復刻 ChatGPT,而是讓 AI 更懂你。每一次你提問,每一次你追問,每一次你覺得“這個答案對了”,你都在教 AI 什麼是真正有用的回答。這就是 AI 開始聽懂人的方式。 (AI 深度研究員)
GEO爆火!流量7倍增長,紅杉、輝達搶著押注AI新生意
搜尋,曾經是網際網路最完美的商業模式,撐起了市值超2兆美元的Google。但時代變了。連馬斯克都直言,“AI將取代搜尋”。這背後,不只是使用者習慣的小變化,而是一場對傳統網際網路行銷的顛覆。簡單說,SEO的邏輯正在被淘汰,取而代之的是GEO。GEO(Generative Engine Optimization),是讓品牌在生成式AI的回答裡,被精準、正面、且高頻地提及。當“零點選”成為常態,GEO從可選項變成了必選項。它不僅重寫了廣告的形態,還打開了新的產業機會。資本的嗅覺最快。不久前,紅杉領投了GEO公司Profound。這家公司成立還不到一年,就完成了三輪融資,投資人名單裡既有紅杉這樣的頂級VC,也有輝達這樣的產業巨頭。那麼問題來了:紅杉為什麼看好Profound?GEO的產業機會究竟在那?今天,烏鴉君藉著Profound的融資,展開聊聊。/ 01 / 第一個頂級風投Pick的GEO公司一個不得不承認的事實是,AI正在“吃掉”傳統搜尋。現在,Google AI Overviews、ChatGPT Browse、Perplexity、Claude、Gemini等平台每天要處理數億次查詢。Gartner預測,到2026年,傳統搜尋引擎流量將因AI聊天介面的興起下降25%。伴隨著搜尋的衰落,廣告行銷的邏輯正在發生巨大的變化。二十多年來,SEO一直是在搜尋邏輯下提升網路曝光度的最佳策略,市場規模一度超過800億美元。傳統SEO拼的是搜尋排名,排名由基於關鍵詞匹配度、內容深度和廣度、反向連結、使用者體驗參與度等因素的網站索引決定。而到了AI時代,這套邏輯玩不轉了。使用者提問對象變成了ChatGPT、Claude、Gemini,內容不再通過網頁點選,而是直接生成答案。這意味著:你不能再只關心搜尋排名,而是要關注“模型記不記得你”或者說“是否願意主動提你”。如果你的內容沒被AI“記住”,你就輸了。於是,一種新的廣告範式正在興起,它不再由頁面排名驅動,而是由語言模型驅動,這就是生成引擎最佳化(GEO)。一個案例說明GEO的力量:在DeepSeek、Claude或豆包裡問“什麼AI玄學產品好”,某F產品頻頻被推薦;再用GPT、Gemini Deep Research或Kimi-Research做橫向調研,它依然是標竿案例。GEO的價值在於,它決定了使用者在AI回答裡能否“看見”你。而這一變化,正在催生一批新的創業公司。其中的典型代表是Profound。Profound定位為企業級GEO工具,目前已經服務了500多家企業、超過2000名行銷人員,覆蓋金融、B2B SaaS、快消、零售等多個行業。客戶的反饋非常直接:AI可見度提升後,新增收入往往能達到數十萬美元,而且能夠清晰追溯到AI助手的推薦。Profound專為AI環境而生,支援多語言GEO分析與主動爬蟲管理。簡單來說,它會先弄懂AI怎麼想,再“教”AI怎麼答。為了搞懂AI的回答邏輯,公司推出了三項監控工具:1.答案引擎洞察(Answer Engine Insights),即時抓取AI怎麼“嘴”品牌;2.代理分析(Agent Analytics),看清各路AI爬蟲如何拆品牌的網站、讀品牌的內容;3.對話檔案總管(Conversation Explorer),扒出全球使用者在問AI什麼、缺什麼。他們很快發現了一個規律:在高權重平台(Reddit、YouTube、LinkedIn、Medium)發佈內容,更容易被AI引用。Profound資料顯示,Reddit是所有主流模型中被引用次數最多的平台,Reddit最新財報引用了這條結論。▲Reddit最新財報引用了Profound知道了AI的回答邏輯,下一步是生產足夠多能讓AI引用內容。為此,Profound提供一站式“寫給機器人看”的內容打包服務:對比稿、社媒帖、落地頁,全都為AI調過味。經過客戶實測,品牌被AI推薦的次數最高能翻7倍。今年7月,Profound又上線主動最佳化功能,包括:模擬人類提問,預測那些內容更容易被AI推薦;輸出結構化最佳化建議;一旦品牌被AI錯誤分類,立即預警並給出修正方案。這樣一來,行銷人員能在同一後台完成“內容生產—發佈—監控—調優”的閉環。過去需要幾個月、動輒幾十人團隊的GEO戰役,現在只要一杯咖啡的工夫。目前,Profound的定價:Pro版:499美元/月,含200條日提示、2.4萬條月回答、3個席位、2個月資料保留及核心功能;Enterprise版:定製訂價,支援多國多語言、無限制資料深度與保留期,配備專屬策略師和代理商級支援。/ 02 / 誰在教AI“認識”品牌?六家GEO公司的答案當前市場上,很多號稱GEO的服務,本質上還是在走SEO的老路:以關鍵詞展示為核心、靠代理模式拉客戶,說白了是“萬詞霸屏”與“快排”的翻版。這類方法或許能短期沖排名,但並不能真正解決品牌在AI對話中的可見性與品牌性建構問題。真正的新一代GEO玩家,不再追逐點選量,而是專注於“教AI如何理解、信任並主動推薦品牌”。它們的產品大體分為幾類:幫品牌做內容、盯AI、跑沙盤、做本地化,或者將SEO原則與GEO策略結合。在這裡,烏鴉君梳理了一些有特點的GEO公司,值得重點關注:1.Contently:把內容做成“問題答案”2024年收入口徑在2150萬~5380萬美元之間,累計融資700萬~1900萬美元。這是一個一站式內容行銷平台,擁有16萬+稽核過的記者與創作者資源,幫助企業完成選題、審稿、合規與發佈。亮點在於,它能把內容加工成“直接回答問題”的結構,讓AI更容易呼叫,從而提升流量與轉化。公司宣稱,可讓AI帶來的流量提升42%。2.AthenaHQ:SEO服務團隊的GEO儀表盤2025年6月,公司了完成220萬美元種子輪融資,YC、Amino、Red Bike等參與。其平台能即時監控品牌在AI回答中的“引用率”與“精準率”,並將“遺漏/錯引”的問題轉化為可執行工單,交給SEO/內容團隊閉環處理,支援ChatGPT、Claude、Gemini、Perplexity等六大引擎。創始團隊來自Google Search與DeepMind,目前已服務100+中大型客戶。3.PeecAI:輕量化GEO套件2025年4月,PeecAI獲得了190萬美元Pre-Seed,7月又融520萬歐元,成立僅5個月。其定位是中小企業的輕量工具包:每月120歐元,提供AI可見度追蹤器(visibility tracker),並按周輸出PDF摘要報告。相比重度方案,它更適合預算有限的SMB。4.RankScale:LLM沙盤模擬RankScale提供LLM搜尋引擎的“沙盤”環境,可模擬ChatGPT4o、Claude3、Gemini2等的回答表現,並支援A/B測試與內容架構最佳化。該工具還具備爬蟲檢測和每小時資料更新的能力,尤其適合代理機構、內容創作者與技術型行銷團隊進行快速試錯。5.OtterlyAI:49美元的“錯誤資訊哨兵”2025年3月,公司獲得了400萬美元種子輪融資,Mayfield領投。OtterlyAI主打“錯誤資訊捕手”,其GEO稽核模組基於30個可見性因素即時評分。金融、醫療等強監管行業常用它來抓取AI回答中的過時或有害陳述,並生成角色感知報告。49美元起,小團隊能用得起。6.MarketMuse:GEO權威分模型2024年,MarketMuse的收入約890萬美元,累計融資1000萬美元股權+275萬美元債務。特色是將GEO融入內容工作流:通過“主題權威分”量化品牌在某領域的競爭力,再輸出缺口內容計畫,並落地到寫作/最佳化任務。monday.com使用後,自然流量增長了15倍。總的來說,GEO賽道才剛剛起步,但方向已十分清晰:GEO則在系統性提升品牌AI世界的存在感和信任感。紅杉對Profound的押注,可能只是序章。隨著AI重塑資訊分發,整個行銷生態的底層邏輯正在被徹底改寫。 (烏鴉智能說)
巴倫周刊—Google搜尋正在式微,整個網際網路或將隨之衰落
網際網路的命脈正在枯竭,搜尋引擎的衰落對使用者、企業和股市意味著什麼?在21世紀,遇到突如其來的疼痛時,人們通常會先上網搜尋,而不是立刻打電話給醫生。比如在Google上搜尋“胸痛”、“高燒”或“皮疹”,螢幕上會出現一連串藍色連結,接著就是在網路上的一番瘋狂尋找。類似的模式也出現在搜尋“今日天氣”、“附近餐廳”以及“高收益分紅股票”等內容時,只是焦慮感會少一些。根據分析公司Semrush的資料,全球排名前列的網站中,大約五分之一的訪問都是從搜尋引擎開始的。在維基百科,搜尋帶來的全球訪問量佔比高達63%;在旅遊網站Tripadvisor,這一比例為58%;而在本地點評網站Yelp,則為51%。但在過去一年裡的大部分時間裡,網際網路搜尋流量一直在下降,因為網路使用者開始嘗試由OpenAI的ChatGPT和AI初創公司Perplexity AI等人工智慧驅動的搜尋服務。根據Similarweb的資料,目前來自AI搜尋引擎的推薦流量只彌補了大約10%的傳統搜尋損失。Google正在通過在搜尋結果頂部加入AI生成的摘要來進行反擊,這一做法削弱了傳統的藍色連結,從而進一步減少了搜尋流量。五月份可能會成為一個轉折點。根據Similarweb的最新資料,上個月美國主要旅遊和旅遊網站的搜尋推薦流量同比大幅下滑了20%;電商公司的推薦流量下降了9%。新聞和媒體網站的搜尋流量減少了17%;金融、生活方式以及美食飲品等類別在本月也出現了類似的下滑。在整個網路經濟中,趨勢已經非常明顯:搜尋流量正在枯竭,Google也不再是為網站帶來使用者的唯一明確途徑。這一變化已經開始迫使各行各業進行自我反思和調整。就在上個月末,知名數字新聞媒體商業內幕(Business Insider)裁員了21%,原因是其流量下降,“超出了自身的控制範圍”。商業內幕首席執行官芭芭拉·彭(Barbara Peng)在給員工的信中寫道:“商業模式正面臨壓力,分發管道變得不穩定,爭奪使用者注意力的競爭比以往任何時候都更加激烈。”Reddit,是一個社交媒體網站,也是許多隨機問題答案的來源,其57%的訪問量來自搜尋,目前正與人工智慧公司達成合作,並推出了自家的AI驅動搜尋引擎。作業輔導公司Chegg在2021年市值曾高達151億美元,今年早些時候表示,流量下滑讓公司別無選擇,只能探索包括可能出售在內的戰略選項。在華爾街,沒有那家公司比Google本身更擔憂搜尋業務的未來。母公司Alphabet今年股價已下跌7%,在一些投資者的基準中,如今甚至被歸類為價值股。不過,Google也有應對之策。首先,它已經將業務多元化,成為雲端運算領域的巨頭,並且在新興的自動駕駛領域表現出色。在生成式人工智慧領域,Google同樣實力不俗,擁有大量資源來打造和完善其Gemini大型語言模型。相反,隨著傳統搜尋的重要性逐漸減弱,真正受影響的將是網際網路的其他部分。根據Similarweb的資料,今年五月,美國使用者每月通過搜尋訪問Schwab.com的流量首次出現至少兩年來的下滑,下降了14%。而一年前,施瓦布的搜尋引薦流量還增長了179%。TripAdvisor的搜尋流量當月大跌34%,星巴克官網的流量也下降了41%。即便是數位化戰略的先驅Netflix,其搜尋流量也減少了23%。關於流量的討論讓人想起了上世紀90年代和21世紀初Google尚未出現時,各家公司還在摸索如何在全球資訊網上吸引使用者的情景。高管們正在大力宣傳與OpenAI的ChatGPT、Perplexity以及其他由人工智慧驅動的搜尋工具的合作。“我們正在與AI搜尋公司合作,確保我們的品牌能夠在客戶查詢中有良好展示,”Expedia首席執行官Ariane Gorin在五月表示,“同時打造新的體驗,以便在我們的生態系統之外與旅行者建立聯絡。”但這條路還很長。根據Similarweb在美國的估算,Expedia在五月份通過AI搜尋引擎獲得了8.8萬次推薦,而通過傳統搜尋引擎獲得的推薦則有3400萬次。Google效應ChatGPT在2022年11月首次公開亮相時,還是一種新奇的事物,在網路上掀起了一波創作歌曲、詩歌和文章的熱潮。但最新的模型更加先進,並承諾具備類人的推理能力,這推動了新一輪的使用熱潮。ChatGPT在三月份的每周活躍使用者達到了5億,而去年十二月為3億。其中許多人每月支付20美元使用服務;母公司OpenAI表示,本月其年化營收達到了100億美元,而去年年底為55億美元。另一家初創公司Perplexity則更直接地向Google發起挑戰。Perplexity在其關於頁面上寫道:“直通世界知識的通道——內容精煉、標註來源、表達清晰。沒有噱頭,沒有廢話,只有有道理的答案。”(Barron’s的母公司道瓊斯已因版權侵權起訴了Perplexity。)隨著人工智慧對Google的壓力不斷加大,這家公司開始採取措施,捍衛其在美國搜尋市場89%的份額。一年前,Google在搜尋結果頂部推出了所謂的AI概覽,承諾為搜尋查詢提供簡明的AI生成答案。這些AI概覽最初只出現在少量搜尋中,但現在出現的頻率越來越高。研究公司Ahrefs的分析顯示,從3月12日到5月6日,AI概覽的覆蓋率已經翻了一倍多。AI摘要在網際網路上引發了廣泛討論,出版商擔心,使用者只需看幾段AI生成的答案就能獲得所需資訊,無需再點選查看更多內容。根據Similarweb今年3月的資料,帶有AI概覽的搜尋只有23%的情況下會被點選,而沒有AI概覽的搜尋,點選率則為36%。“我們發現,當搜尋結果中顯示AI答案時,與沒有顯示答案的搜尋結果相比,點選率出現了驚人的下降,”搜尋引擎最佳化(SEO)顧問、《Growth Memo》部落格作者凱文·因迪格表示,“這簡直是點選量的殺手。”Google對Barron’s表示,第三方資料並不能全面反映搜尋趨勢。今年二月,線上教育平台Chegg表示,搜尋趨勢已經重創了其業務。首席執行官內森·舒爾茨(Nathan Schultz)對投資者說:“如果Google沒有推出AI概覽,保留了原本會流向Chegg的流量,我們根本無需考慮戰略調整。這對我們的使用者獲取、營收和員工都產生了重大影響。”在被要求置評時,該公司指向了其今年二月對Google提起的一項訴訟。訴訟稱,Google利用其搜尋領域的主導地位,“強迫像Chegg這樣的線上出版商提供內容,而Google則在AI生成的答案中未經許可地重新發佈這些內容,從而在網路上不公平地與出版商爭奪使用者關注。”自2021年以來,Chegg的股價已暴跌99%。Google表示,其AI概覽功能提升了搜尋體驗,並且正受到使用者的歡迎。一位Google發言人稱,AI概覽在搜尋結果頁面上展示了更多連結,涵蓋了更廣泛的來源。“比任何其他公司都更重視為網路輸送流量,Google每天依然為各類網站帶去數十億次點選。”Google發言人對Barron’s表示。今年四月,在Google的財報電話會議上,一位分析師向公司高管詢問了AI摘要功能對點選率的影響。Google首席商務官菲利普·辛德勒(Philipp Schindler)表示:“我認為現在還不是討論點選率、轉化率等細節的時候。但總體來說,我們對目前的情況感到滿意。”(插圖作者:Nicolas Ortega)“大規模施工”Reddit已經成為關於搜尋未來的爭論焦點和主戰場。由於投資者擔心這家社交媒體網站的使用者增長放緩,其股價今年迄今已下跌28%。公司將這一趨勢歸因於搜尋方式的演變。Reddit在搜尋領域依然表現突出,公司指出,“Reddit”是Google上第六大搜尋詞。不過,近幾個月流量趨勢發生了明顯變化。根據Similarweb的資料,2024年5月,Reddit的搜尋引薦流量激增了78%。今年5月,網站的搜尋訪問量同比增長了14%。與此同時,Reddit的日活躍使用者增長率也有所下降,從2024年第一季度的37%降至2025年的31%。Reddit首席營運官詹妮弗·王(Jennifer Wong)在接受Barron's採訪時表示,搜尋業務正處於“大規模建設”階段。王對Reddit的長期發展機會充滿信心,並指出其由使用者生成的內容在訓練運行AI的大型語言模型時將變得尤為重要。Reddit已與OpenAI達成合作。目前,這類內容授權業務在公司整體收入中佔比仍然很小,在最近一個季度還不到9%。王表示,“沒有人知道Google將如何跨越這道鴻溝,也沒人能預料這會在網際網路產生怎樣的連鎖反應”。“但我知道,人類智慧依然非常有價值,而且這種價值只會越來越高,而我認為Reddit正是展現這一點的平台。”華爾街普遍認同這一觀點。在覆蓋Reddit的29位分析師中,給出的平均目標價為152美元,比其最新收盤價高出31%。展望未來,投資者應關注一家公司的搜尋依賴度。在各個行業中,某些品牌對Google流量的依賴明顯較低。以Airbnb為例,根據Semrush的資料,今年3月其搜尋引薦流量佔比為14%,而旅遊公司Tripadvisor則高達58%。DoorDash和Uber Technologies的這一比例均為13%。像Pinterest和Meta旗下Instagram這樣的社交媒體應用,對搜尋的依賴也遠低於網際網路平均水平,分別有23%和17%的流量來自搜尋。今年五月,Pinterest的首席執行官向投資者表示,有85%的使用者會直接通過公司的移動應用程式訪問平台。避險搜尋風險Meta Platforms與Google基本上平分了線上廣告市場,因此處於非常有利的位置。隨著搜尋流量的下降和傳統搜尋廣告的衰退,企業將不得不在Instagram和Facebook上投放廣告,而這兩大社交網路因不依賴搜尋流量而免受搜尋領域變革的影響。與此同時,Meta可以利用人工智慧提升廣告的效果和個性化程度。在Google忙於應對人工智慧帶來的挑戰時,Meta則可以毫無顧慮地全面擁抱AI。歸根結底,對抗AI顛覆的最佳避險選擇,就是賦能整個行業的公司——輝達。隨著AI的爆發,輝達將會售出更多AI晶片以及為資料中心提供動力的基礎設施。輝達CEO黃仁勳在公司最近的財報電話會議上向投資者表示,最新一代以推理為核心的AI模型對輝達來說尤其有利可圖,因為它們所需的計算資源是以往AI聊天機器人的一百倍。他表示,“推理模型正在推動推理需求出現階躍式激增”。從顛覆者到被顛覆者Google搜尋在二十年來首次面臨威脅,一位美國地方法官正在裁定這家公司的命運。2024年8月,法官阿米特·梅塔裁定,Google在通用搜尋服務和通用文字廣告領域構成壟斷。Alphabet及其投資者現在正等待法官裁定可能的補救措施。審判的處罰階段已於上月結束,梅塔法官預計將在八月作出最終裁決。這一時間點頗為引人注目。就在Alphabet被裁定為壟斷企業的同時,它還在大力推出AI綜述功能。不到一年後,隨著使用者越來越多地使用聊天機器人,搜尋領域正面臨著巨大的競爭變革。蘋果公司(Apple)服務高級副總裁埃迪·庫伊(Eddy Cue)作證稱,隨著人們越來越多地借助AI進行搜尋,蘋果瀏覽器上的搜尋量在四月份首次出現下滑。Google每年向蘋果支付數十億美元,以確保其搜尋引擎成為蘋果瀏覽器的默認選項。但不要指望Google近期的疲軟表現會影響梅塔法官的裁決。多夫·尼爾森(與扎烏德律師事務所(Dorf Nelson & Zauderer)合夥人安東尼·海恩斯(Antony Haynes)在接受Barron's採訪時表示,儘管自法官作出裁決以來,這些新的競爭威脅變得更加普遍,但這些威脅不太可能影響法官對補救措施的決定。“我們現在考慮的補救措施,並不是針對未來可能出現的技術變革,而是針對他們過去的行為。”海恩斯說。這些過往行為包括創造了有史以來最成功的商業模式之一。去年,Alphabet的營業利潤率為32%,而標準普爾500指數成分公司的整體利潤率僅為14%。與此同時,自2004年Alphabet上市以來,其股票的年化回報率為23.7%,而標準普爾500指數為10.6%。後搜尋時代可能會對這些利潤率造成壓力,但Alphabet的股價已經反映出公司正步入下一個階段。其市盈率為未來12個月預期收益的17.8倍,低於標準普爾500指數的22.5倍。Barron’s 一直對該股票持看漲態度,包括在2024年11月的封面報導以及上個月的後續報導中。Google不會有問題,真正該擔心的是網際網路的其他公司。(作者|亞當·萊文、金泰、安吉拉·帕倫博) (Barrons巴倫)
Google I/O 2025:搜尋帝國的自我革命與AI翻身仗
上世紀末,Google的搜尋引擎永遠地改變了人們獲取資訊的方式。25年後,這家如今的科技巨頭大膽宣稱:未來的搜尋將是一個完全由AI驅動的世界。今年5月,Google在其最大的開發者盛會Google I/O上推出了AI重塑的搜尋引擎,使用者可以向AI提出複雜的問題,甚至加以追問,而AI會進行相應的搜尋並回答你的提問。這不僅是巨頭的一場自我革命,更是對Perplexity和OpenAI等AI新貴的強力回應。同時發佈會還推出了Gemini 2.5 Pro模型、XR眼鏡等一連串重磅更新,其實Google在技術上的實力毋庸置疑,但其產品化能力卻一直備受質疑。我們在I/O現場的明顯感受是:如今的AI之爭不再是拼誰的模型跑分高,而是拼誰能先把AI真正用起來。生成式AI的熱潮正在褪去,AI Agent的時代已經開始了。但在這些技術突破之外,大家更關心的問題是:Google,還是那個能夠顛覆行業的Google嗎?這家公司有技術、有人才、也有錢,但近幾年來推出的產品好像總差點意思:雖然Transformer架構誕生於Google,但從中受益最多的卻是OpenAI;如NotebookLM這樣的產品,儘管初看驚豔,但似乎在商業應用上有些“雷聲大雨點小”。本篇文章我們就藉著這次I/O的機會聊聊,現在AI產品的競爭,到底是在拼什麼?01Google I/O更新內容Chapter 1.1 AI Mode重塑搜尋從去年I/O開始,Google加入了名為AI Overview的AI生成摘要功能。雖然AI Overview曾因為“建議在披薩上塗膠水”等回答被使用者吐槽,但Google表示,這項功能的月活躍使用者已經超過15億。它現在也將從實驗室畢業,推廣至200多個國家和地區、支援40多種語言。本次更新的AI mode則是AI Overview功能的一次升級,是Google最核心的搜尋功能結合了Gemini 2.5模型後的產品:Google不再是簡單地提供AI總結,而是可以回答覆雜、多步驟的問題,未來還會支援更複雜的體育與金融資料問題,甚至呼叫使用者的個人資料生成個性化的答案。AI Mode也加入了一個叫做Deep Search的功能,與OpenAI的深度搜尋對標,在收到使用者的問題後生成一份帶引用來源的完整報告,能節省好幾個小時的研究時間。Google官方建議,Deep Search適合於購物等容易犯選擇恐懼症的場景。AI接管購物流程的例子比比皆是,AI試穿就是一個很有趣的例子:AI Mode下,使用者上傳自己的照片,AI就能模擬你穿上某件衣服的樣子。Google說這個“試穿”功能可以識別不同布料、彈性和3D形狀,現在已經在Labs中上線。幾個月後,Google還會推出一個“自動下單”工具:當商品降到使用者設定的價格後,AI Agent可以主動幫你下單(當然,最終仍需使用者點選確認)。未來還會有“Search Live”功能,能直接結合手機的攝影機,讓AI根據使用者眼前看到的東西即時對話、提供資訊。從去年的AI Overview到今年的AI Mode,再加上各項套用多模態模型,基於Agent的功能,萬變不離其宗的都是Google核心的搜尋技術,也說明了一點:Google意識到,它必須重新定義搜尋,才能在AI時代保住它的地位。過去二十年,“搜尋等於Google”,這是一個毋庸置疑的事實。但進入生成式AI時代後,一切開始動搖。2022年ChatGPT剛上線的時候,Google立刻拉響紅色警報,意識到AI正在威脅它的舒適區。但那時候,Google沒怎麼動,畢竟它不是初創公司,手上捧著的是年營收超過2000億美元的搜尋業務,佔了全公司一半以上的收入。你很難指望這樣一個體量的巨頭,敢拿出“會幻覺”的AI,直接替代穩妥靠譜的搜尋引擎。於是,Google選擇了穩一點、慢一點。但三年過去,它卻不得不面對一個現實:搜尋這塊最核心的地盤,真的開始被類似Perplexity和OpenAI這樣的AI初創公司搶走了。劉沁東(Bruce Liu)美國濟容投資CEO兼首席投資官:隨著AI、GPT等新的工具和流量入口的出現,我覺得對Google、尤其是對華爾街最大的困擾是:Google還能不能保持它在搜尋上面的優勢地位?丟市場份額是一定的,但是丟到什麼程度、要付出的代價還不確定。今年五月的一起反壟斷案的庭審中,蘋果高管Eddy Cue承認:Google的搜尋流量在過去22年裡首次出現下滑,因為越來越多使用者開始用AI搜尋替代傳統搜尋。這對Google的打擊,尤其在資本市場上是巨大的,我們會在最後一章展開分析。Google在本次I/O的發佈中,便是在用這一整套AI搜尋系統守住它的護城河——這不僅是技術的更新,更是使用者習慣的重塑。但是,這不可避免的也會涉及智慧財產權的問題以及和內容出版商之間的漫長博弈;而這也將是我們接下來關注的重點。Chapter 1.2 Gemini能力提升對於關注I/O的開發者來說,搜尋以外最讓人興奮的更新應該是Gemini 2.5的各大新功能。GoogleDeepMind的CEO Demis Hassabis在展示Gemini 2.5的時候,重點強調了它能深度思考的能力,這個過程被稱為“Deep Think”。Deep Think採用了所謂的“平行推理技術”,允許模型在生成回答之前,探索多個可能的解答路徑,從而提高答案的精準性。Sergey BrinAlphabet Inc.聯合創始人兼董事:如果AI能夠在提供方案之前先深度思考,顯然會更加強大,而我們現在看到的只是AI能力的冰山一角。這些能深度思考的模型出現還不到一年時間,尤其是AI在其思考過程中還可以使用許多工具,甚至利用其他AI來改善最終輸出結果。因此,我認為這將是一個非常強大的範式。Google這次還給開發者帶來了兩個新的訂閱服務:月費20美元的Google AI Pro和月費高達250美元的Google AI Ultra,直接對標ChatGPT Pro和Claude Max(兩個服務各為200美元/月)。Ultra使用者可以使用Google最新的圖像模型Imagen 4和視訊生成模型Veo 3,還能搶先體驗最新AI能力,比如自動生成帶音效的視訊畫面。Shaun WeiHey Revia創始人ex-Google Assistant:無論是OpenAI的Sora,還是文生圖(Text To Image)、文生音訊(Text To Audio)等各種各樣的嘗試,大家都想達到一個目標:把大腦裡面想像的東西變成電影的畫面。我覺得在Google的發佈會上,我看到了真正把想法變成視訊的演示。對於大部分使用者而言,Gemini Live的攝影機和螢幕共享功能也已經在移動裝置上開放了。使用者可以邊走路邊拍攝周圍街景,直接問Gemini:“這棟建築是誰設計的?”或“這是什麼風格?”,而AI會基於手機即時畫面回答問題,幾乎沒有延遲。該功能背後依託的是Google的多模態AI系統Project Astra,它能理解圖像、語音、文字,並與你進行自然對話。不久之後,Gemini Live還將與各項Google的效率產品整合。使用者可以邊對話,邊建立日程、生成路線或安排待辦事項。而Project Astra這個多模態系統,其實也寄託了Google在AI上最大的野心。它本身並不是一個面向消費者的產品,DeepMind的Greg Wayne將它看作一輛“概念車”,展示Google對未來AI助手的全部想像。它背後的目標只有一個:打造一個真正通用、懂你、會幫你做事的AI助手。在I/O上,Google宣稱Astra不再只是被動等使用者提問,而是自己判斷什麼時候說話、說什麼話。比如你正在寫作業,它能看出你哪裡算錯了,直接提醒你;又比如你在間歇性斷食,它甚至會在你打破禁食時間前問,你確定你現在應該吃東西嗎?Hassabis將Astra稱為讀空氣的AI(reading the room),認為這才是真正的助理。Project Astra的很多功能,未來會逐步下放到Gemini和其他Google產品中。但實際上已經有一個應用場景呼之慾出了,這就是眼鏡。Chapter 1.3 XR眼鏡今年I/O展示的硬體更新並不多,但眼鏡可以說是大家關注的主角。在I/O上,Google展示了和三星、Gentle Monster、Warby Parker等品牌合作開發的一款樣機。這幅XR眼鏡叫做Android XR,並且搭載了Gemini AI。演示上展示的幾個功能包括了即時翻譯、導航輔助、視覺識別等等。我們也在現場體驗了這款XR眼鏡。眼鏡本身佩戴感很好,與普通眼鏡重量幾乎無差。戴上眼鏡後,除了發佈會視訊中演示的與Gemini交流、播放音樂之外,還可以使用Gemini鑑賞油畫、根據風景圖片分辨並制定相應地點的旅行計畫等。雖然並沒有體驗到發佈會演示中用XR眼鏡看地圖和即時翻譯的功能,不過總體而言,這個體驗很新奇,也很符合大眾對XR眼鏡的期待。當然,Google這次一口氣發佈了十幾項更新,聚焦在AI及各類開發工具。這就比如說可以基於瀏覽器執行複雜任務的多模態AI agent Project Mariner。作為做中英文內容的創作者,我們最感興趣的功能之一,其實就是跨語言的即時轉換。如果一個AI助手能在我們錄製播客或剪輯視訊時,直接把中英文內容自然地同步處理並轉寫,那將極大提升我們的效率。以上是粗略的體驗分享,這也體現了Google這樣的巨頭在AI時代的獨特優勢:行業領先的模型、全球搜尋流量,和強大的底層技術。用Google自己的話說,這種規模(scaling)是初創公司很難趕上的。接下來聊聊開發者希望從今年的AI模型更新中看到的新能力。02開發者想看到什麼?Kimi KongEnergent.ai聯合創始人ex-DeepMind:Google I/O讓我印象最深的是Google對於它旗下模型和產品的橫向廣度與縱向深度的一個整合。這讓我覺得,Google對於未來已經進行了全面佈局。Kimi Kong曾在GoogleDeepMind工作,參與過大語言模型評測和AI Agent兩個關鍵項目。他認為,本次Google I/O的最大亮點之一,是Google展示的“大一統模型”的雛形。從廣度上來看,只需要一個Gemini模型,就可以執行問答、程式碼生成、多輪對話、圖像識別、視訊理解等多種任務,涵蓋了開發者在不同模態下的主要應用場景。從深度上來說,Google不僅提供模型能力本身,還進一步展現了這些能力如何被落地到真實產品中,給開發者留下了極大的想像空間。比如,在搜尋這個縱嚮應用中,AI不僅能在雲端幫助使用者生成結構化答案,還可以部署到可穿戴裝置。就像我們在體驗XR眼鏡的時候,只要是視野內看得到的問題,就可以向Gemini提問,而Gemini會幫我我們進行搜尋。然而,在眾多更新裡,其實很難看出最後哪些能夠在產品化上實現成功。Shaun WeiHey Revia創始人ex-Google Assistant:Google的產品一直是它的弱項,大家都知道這點。所以我覺得,Google這次就是要圍繞它強勁的Gemin模型來打造自己的生態。Shaun Wei曾在Google負責語音助手項目。他告訴我們,從外部來看,Google目前的策略就是一次性發佈大量產品。一旦發現哪個產品真正跑的出來,就可以再加大投入。比如,2023年7月發佈的NotebookLM,一開始只是一個相對小的項目,但面向公眾開放後卻收穫了大量好評,於是Google才開始傾斜資源。而Google自己強大的技術是毋庸置疑的,主要有幾方面優勢:1.硬體生態2.自己的雲服務Google Cloud以及資料中心3.海量可以用於訓練AI的資料4.強大的演算法團隊Shaun WeiHey Revia創始人ex-Google Assistant:Google在底層的時候就已經比大部分公司有優勢了,基本上沒有多少公司能做這個事情。所以Google如果通過一年的努力變成整個模型的第一,我不會覺得奇怪。在Google提供了全端式服務之後,那些做AI Agent的初創公司還做得下去嗎?Shaun WeiHey Revia創始人ex-Google Assistant:對於To C的公司確實是影響會非常的大,因為大公司的模型能力很大,而且大部分巨頭最先考慮的就是面向C端使用者來擴大能力。其實很多簡單的功能,比如打電話,AI Agent只需呼叫一個工具就能做的事情,它開發的門檻是越來越低的。如果你解決的垂直賽道里邊,它的工具量特別的少,或者它對於整個商業、工作流的邏輯特別少的話,確實有可能會直接被大公司取代。Kimi KongEnergent.ai聯合創始人ex-DeepMind:百家齊放的狀態也給初創企業帶來了機會:正因為不同模型各有所長,才有了初創企業把不同模型整合、完成非常複雜的任務,並捕捉這個垂直且深度市場的機會。在聊完Google在技術層的突破後,我們再來看看,華爾街現在怎麼看待Google這家公司的。03華爾街想看到什麼?Google I/O首日,Google的股價跌了1.5%。5月21日(I/O的第二天),Google的股價開盤上漲5個點。各大銀行分析師都指出,Google的AI資產被低估了。I/O期間的發力,很可能是Google成功打贏這場AI競爭的核心。劉沁東(Bruce Liu)美國濟容投資CEO兼首席投資官:追重要的是Google的全端式服務(Full Stack),真正地利用好了Google所有AI能力,包括它現有的龐大的使用者群、它強大的分發能力(distribution)。把AI的能力完全地巢狀進來,變得特別的清晰。正如前文反覆提及的,這就是Google作為一家科技巨頭難以被超越的地方。在I/O之前,資本市場對Google一直有一個疑問:為什麼大部分突破性的技術都發源於Google,但從中收益、將這些研究產品化的卻是別人?可以說Google是起了個大早,趕了個晚集。Google現在終於在I/O期間初步證明了自己產品化的能力。然而,這並沒有解決Google的核心問題:AI搜尋可行,但卻不一定能夠盈利。過去Google之所以可以通過搜尋賺的盆滿缽滿,主要是因為廣告:使用者的每一次搜尋,其實背後都有一場無聲的競價戰。廣告商會通過關鍵詞付款,所以那些關於購物和比價的搜尋,都是Google源源不斷的印鈔機。但是在AI搜尋模式下,還仍然沒有一個投放廣告的方式。劉沁東(Bruce Liu)美國濟容投資CEO兼首席投資官:我試用了Google的AI mode,當我問它lululemon新出的裙子時,看不到任何能夠放廣告的地方,它也沒有想到插廣告的辦法,這也是業界的爭論點。我覺得,什麼時候大家找到了在AI對話裡面怎麼合理地去放廣告、收廣告,新的機制被搭建起來之後,這個問題才算解決。但除了I/O期間的股價變化之外,Google今年的股價其實一直沒有大幅度的突破,自二月達到52週最高點後就持續回呼。同時,川普4月初宣佈全球關稅之後,依賴於出海電商廣告業務的Google和Meta都受到很大影響,所以也在那段時間出現了下跌。但總體來說,五月之前股價的變化和Google公司本身的營運狀況關係並不大。5月7日,Google的股價卻迎來一次大幅下跌,最大的原因就是之前提到的蘋果高管Eddy Cue的發言,認為Google的搜尋業務正在受到AI威脅。但其實這裡還有一個更大的背景,就是Google正在面臨兩項由美國政府發起的重大反壟斷訴訟。第一起訴訟指控Google在搜尋引擎市場中濫用其主導地位,利用與裝置製造商和瀏覽器的默認設定協議,阻礙競爭對手的發展。第二起訴訟則聚焦於Google在數字廣告領域的行為,指控其通過收購和整合廣告技術平台,非法維持其在廣告市場的壟斷地位。這些訴訟不僅可能導致Google被迫改變其商業模式,甚至面臨拆分公司的風險。劉沁東(Bruce Liu)美國濟容投資CEO兼首席投資官:當然,這並不代表Google立刻就要被分拆,Google在這方面的訴訟非常有經驗,也花了很多錢在律所、法務團隊上。想要提起訴訟並真正拆分Google,會是一個非常耗時間的過程,即使需要5年、10年也不奇怪。但是,有了這麼多年打官司的經驗,控方也越來越理解Google在廣告科技(advertising tech)市場上的壟斷到底是怎麼實現的,這對Google造成的風險也確實是越來越大的。但是我認為,市場還沒有真正定價(price in)這點,如果這點變得越來越清晰,Google是有風險被拆分的,到時候會有新一輪的定價。04巨頭依然有難以比擬的優勢不管是從技術還是商業角度來看這次GoogleI/O的發佈會,大家的共識都是:巨頭確實具備難以比擬的優勢。在此之前,Google似乎沒有抓住這個競爭優勢,所以這次的發佈會,很大程度上給大眾吃了一劑定心丸。但就像我們採訪嘉賓分析的那樣,Google這個搜尋巨頭可能確實用AI“革了自己的命”,但這家公司真的還能保住自己的霸主地位嗎?對這個問題,它可能很難給出回答。就像Google很久沒路面的Google聯合創始人Sergey Brin說的那樣:由於AI的出現,我們很難想像十年後的網際網路,甚至十年後的人類世界。以上就是矽谷101對Google I/O以及Google自我革命的梳理,也歡迎大家留言你的想法與感受。 (矽谷101)